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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法 • 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是： 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 




总序 



往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前)的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的文章;另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” (Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型，包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生 ，一 直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以飨 
中文读者时,我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜; 中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈; 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜念涛;美国加州大学 
洛杉矶分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 




许多社会科学学科都以“世代”研究为教学重心，例如人 
口统计学、流行病学、心理学、政治科学和社会学。格伦•埃 
尔德 (Glen Elder ) 曾在其著作《大萧条中的孩子们——社会 
变迁对人生的影响 》 （Children of Great Depression - So ¬ 
da / Change in Life —书中对“世代”这 一 概念进 

行了深人研究。该书讲述了一群孩子在成长过程中种种坎 
坷的经历，对他们而言，现代社会许多司空见惯的东西都是 
遥不可及、需要拼命争取才能拥有的。在本书的讨论中，我 
们以“迷惘的一代”为例，讲述他们怎样在战后努力向社会证 
明自己的能力。正是这些独特的经历造就了关于世代的 
研究。 

一般而言，世代分析属于定量研究的范畴，研究者利用 
很多世代概念的估测方法对一些结果变量的效应进行研究。 
例如，在大萧条时期，经历过战争的社会群体身上的某些行 
为特征。从这种意义上来讲，世代的成员都必须在特定时间 
段有同样的经历。另一方面，同一年出生的人（或特定时期 
出生的人群)经历了同样的社会变迁，或多或少都会表现出 
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相似的性格特征。不同年龄的人有时也表现出这种群体特 
征。例如，同一年开始实习的毕业生们。所以在大多数情况 
下，“世代”指的是某一特定的岀生人群。 

20世纪70年代出版的《大萧条中的孩子们——社会变 
迁对人生的影响》点燃了研究者的研究热情，他们开始寻找 
估测特定社会行为或社会现象以及估计世代效应的方法。 
可这并不简单，因为估测对象不仅仅包括世代（出生年份)的 
效应，还有年龄(出生后）以及特定时期(现有年份）的效应。 
众所周知，如果无法识别限制，那么 APC 线性模型和叠加模 
型也就无法被识别，因为年龄、时期和世代三个因素恰好构 
成一个线性函数式，其中年龄=时期一出生年，为一个恒 

守工、。 

诺瓦尔 • D . 格伦发表的《世代分析》一书中提供了几种 
应对识别问题的新方法。作者在书中对世代分析进行了更 
深层次的讨论，内容涉及方法论基础——包括数据问题一 
并详细讲述了几种可供研究者选择的 APC 估测法。社会科 
学各个学科的研究者都会在此书中获得很多收获，那些研究 
年龄变化以及社会文化变迁的学者们将是最大的受益人。 

專福挺 
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世代分析并不是一项统计技术，而是检验数据时经常采 
用的策略。在过去的几十年中，随着可用数据量的不断增 
加，越来越多的社会科学研究者开始关注世代分析。虽然世 
代分析可以有效地应用于研究与年龄增长及社会文化变革 
相关的重大问题，但显然更多研究者是被其异常神秘的方法 
论难题所吸引的。毫无疑问，这种兴趣并非完全有益。许多 
针对世代分析的研究只是练兵，研究者花了许多精力去证明 
的问题其实在逻辑上不可行。这样的研究导致了许多过于 
自信，却很可能不正确的结论。 

因此，我写这本书的主要目的，一方面是阻止研究者怀 
着这种错误的观念进行机械化的世代研究，另一方面是为了 
鼓励正确的研究方式。能更深入地了解世代分析的方法自 
然很好，但前提是研究者必须谨慎，且拥有足够的专业经验， 
这样才能正确破解其中的奥妙。 




一般来说，研究者会在两种情况下使用世代分析，虽然 
这两种情况都有非常明显的不同目的，但还是引发不少人对 
研究的目的进行一些区分。 

在多数情况下，世代研究主要用于估测人类年龄变化所 
产生的效应，有时也估测婚姻产生的效应。显然，随机实验 
最适合用来估测诱因，但不能用于研究年龄变化产生的效 
应。我们无法将一定数量的个体随机分成实验组和对照组， 
无法观测实验组个体年龄变化的过程，并保证对照组不受与 
年龄变化相关的刺激因素的影响。因此，研究年龄变化效应 
的学者只能在一些非实验方法和准实验方法中进行选择，但 
这些方法都有一定的局限性，世代分析有独特的优点。我将 
在本章的下一节中讨论几种主要的方法。而本书的主要侧 
重点在于讨论与年龄变化相关的研究，但文中也经常出现将 
世代用于分析其他情况的讨论。 

世代分析的第二大用途是帮助研究者理解社会、文化及 
政治变革的根源和性质。这也是为什么世代分析在近几年 
中迅速成为关注焦点的原因之一。也许将来，这种用途会比 
前一种更加普遍。当然，除了世代法，肯定还有其他分析方 
法能够在社会和文化变迁的定量研究中发挥作用，但是世代 
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研究所能达到的深度绝对是独一无二的，在这方面，没有任 
何一种方法能与之媲美。因此，我不会在本书中将世代研究 
和其他方法进行系统化的比较。尽管本书着重于阐释世代 
分析在研究年龄变化中的作用，但是我仍然会用一章的篇幅 
来讨论世代方法是怎样用于研究社会变迁的。 
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第2节 I 定义: 世代研究与相关研究 

方法之间的比较 




英文单词 “ cohort ” 原本用来形容士兵队伍，现在有时用 
来泛指一群拥有某些相同特质的人。而在本书及其他同期 
群分析的文献中，这个词汇被用来形容在特定时间段中经历 
过特定事件的人群。“世代”是社会学研究中最常见的同期 
群研究对象，所谓“世代”，就是指特定年份、某个10年间或 
其他时间段内出生的人群。如果没有限定词特指，那么文献 
中所说的同期群研究就是世代研究。在其他情况下，研究者 
用特定事件来特指同期群研究，比方说，曾经有研究者以退 
休组和毕业组为对象。如果同期群不是人类，那就必须增加 
一个限定词。同期群的种类很多，有以婚姻，也有以参加组 
织活动来定义同期群。虽然同期群的指代对象一般都是世 
代'但也可以是婚姻、组织、课本、电影、车模，或其他任何在 
特定时间段内发生的事件。 

很不幸的是，社会科学文献中居然曾出现“年龄世代”这 
样的定义，由于缺少事件因素，这种说法是不符合规则的。 

① “cohort analysis ” 有多种翻译，如队列分析、出生组分析、同期群分析、同辈群 
体分析、世代分析等。因为后文涉及的主要分析对象都是出生世代，而研究中最常见 
的应用也是出生进代，冴以本15中统译为“ 齿代分 析”。 译者注 
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年龄当然是条件之一，而且是不断变化的条件，但是年龄绝 
对不是时间。如果研究中出现“年龄世代”这样的词汇，我们 
就很难确定其真正的含义——是指世代，还是简单的表示某 
一年龄段的人？ 

这两种含义是截然不同的。打个比方，所有出生在20 
世纪60年代的人被称为“60世代”(“60后”），但是根据研究 
发生的时间，所有个体当时的年龄都是不同的。而只有30 
岁的人才能以年龄归为一类。也就是说，世代每往前退一 
年，年龄组都会发生变化。 

在通常情况下，考虑到一个因变量需要两个时间点的信 
息才能被测量，所以只有两个或两个以上的世代进行对比的 
研究才能称为“世代分析”。不是所有以某一世代为对象的 
研究都是世代研究。比如从2002年11月开始，有研究者分 
别对青年群体、中年群体和老年群体的政治态度进行调査， 
并进行对比;也有人在1995年将某高校1985年所有毕业生 
的政治态度进行对比。这两项研究都不是真正的世代研究。 
前一项是横截面研究，数据从一个时间点或时间段中收集， 
后者是固定样本跟踪研究，为了测量同一群体的某些特征而 
在多个时间点收集数据。两种研究各有所长，都是非常有价 
值的研究，但两者都无法满足绝大多数世代研究的要求，无 
法测量年龄增长所带来的影响，也就是年龄效应。 

横截面数据也能显示年龄所导致的差别，但不能反映年 
龄效应，因为不同年龄的人(或其他研究对象)本身就属于不 
同的世代，其经历不同，产生的影响也不同。换句话说，这些 
不同就是所谓的“世代效应' 举例来说，20世纪20年代出 
生的美国人在青少年时期经历了大萧条，而10年之后出生 
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的人在他们的青少年时期见证了美国前所未有的经济增长。 
我们有理由相信，这种青少年经历的不同会导致两个世代在 
经济政治态度与行为上有着终生的差异。在出生率较低年 
代出生的人被称为“小型生育世代”，他们一生中的经济生 
活、教育、事业和婚恋的机遇和大型生育世代的情况存在很 
大区别，而这些区别也影响着他们各自的态度和行为。因 
此，之所以不能用横截面研究来测量年龄效应或世代效应， 
是因为它会混淆研究结果。比方说，研究者无法弄清导致中 
年人和老年人之间观念区别的真正原因，无法判断到底是因 
为老年人年长，其经历有别于中年人，还是因为各自的出生 
年代不同而导致的差异？ 

横截面研究不适合在年长和年轻的存活个体间测量年 
龄效应的另一个原因在于因变量与寿命之间的相关性。例 
如，美国21世纪初的全国调查显示，中年人饮用酒精饮料的 
比例高于老年人。这个发现本身并不能证明随着男性年龄 
增长，酒精饮料的饮用量会减少。这种差别当然可能部分是 
由世代效应导致，但也可能是一种组成效应，因为饮酒较多 
的人可能比较少饮酒或从不饮酒的人活得更短。大多数世 
代分析都使用从一系列截面研究中获得的数据，因此他们将 
不同死亡率的效应与年龄或世代效应混淆。 

固定样本跟踪研究可以验证由死亡率导致不同的组成 
效应，同时它们也可以处理不断变老的世代中的个体层面和 
汇总层面的变化。但是，固定样本跟踪研究自身也不能为年 
龄效应提供具有说服力的证据，因为并不是所有随着个体年 
龄增长而出现的变化都是由于个体老龄化所导致的。尤其 
是在现代社会中，人们并不是在一个静止的社会中不断变 
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老，而是处在一个不断变化的社会中。随着个体年龄的增长， 
社会或文化变化的影响也作用于他们，这便造成了态度、行 
为、健康和情感的变化，并抵消了年龄增长在静止社会中的效 
应。在跟踪数据研究中，这些时期效应与年龄效应相混淆。 
例如在美国，在加世纪70年代进入青年期的世代可能在20 
世纪80年代后期变得相对保守。我们无法判断这样的转变 
有多少是源自老龄化，因为整个社会也在向着同样的方向变 
化,那么就不能分辨世代间的趋势是不是源于时期的影响。 
因此，对20世纪70年代中期及10年后的高中生的政治态度的 
跟踪研究并不能证明是否有因转变为成年人而带来的影响。 

用固定样本跟踪来研究年龄效应的另一个局限在于，研 
究群体可能受他们在调査中的参与情况的影响。如果这种 
效应发生在因变量上，那么这就是一个固定样本跟踪研究的 
调适效应。在跟踪数据中，这一效应与年龄和时期效应会混 
淆。另一种阐释这个问题的方式，即如果存在固定样本跟踪 
研究的调适效应，随着研究和调查(重复收集数据)次数的增 
力[ I ，一个原本能代表整体的样本将变得不再那么具有代表性。 

固定样本跟踪研究的条件习惯效应可能发生在很多情 
况下。例如，如果因变量是根据一个标准测验测量出的能力 
或者技能，则可能存在一种特殊的固定样本条件习惯效应， 
称为“练习效应”，也就是说，随着固定样本跟踪研究一次又 
一次的进行,研究对象可能适应了测试而有更好的表现。同 
样，不断重复询问有关某一主题的尖锐问题，可能使受访者 
进行深思从而导致态度上的变化。或者，向受访者详细询问 
其工作、婚姻或者其他生活方面，可能会使他们渐渐对这类 
问题产生抗拒。受研究对象年龄增长影响的固定样本跟踪 
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调查非常容易受固定样本条件习惯效应的影响，因为受访者 
可能习得了有效的方法来对他们在研究中的行为进行调节。 

我们可以对固定样本追踪数据进行世代分析，但是很少 
有研究这样做，而且使用两个或两个以上截面研究的一般的 
世代分析可以避免固定样本调适效应。在这种称做“重复截 
面”的设计下，没有个体在多于一个时点接受了调查。相反， 
研究对来自每个世代的不同个体组成的样本在不同的时间 
进行了研究。 

解释世代分析逻辑的一个启示性工具就是标准世代表， 
它通过将不同截面数据并排放置，显示出年龄与其他因变量 
之间的关系，而年龄的区间与进行数据调查的区间是一样 
的。表 1.1 正显示了一个这样的例子,它显示了美国人口普 
查数据中已婚妇女的比例。 

表 1.1 根据年龄和年份分类的女性已婚的比例(美国） 




1968 

1978 

1988 

1998 

25一34 

87.4 

76.6 

67.3 

67.3 

35一44 

87.1 

82. 1 

76.3 

72. 1 

45—54 

82.4 

80.5 

76.2 

70.8 

55—64 

67.7 

70.4 

70.7 

67.8 

65—74 

46. 5 

48.3 

53.3 

54.8 


资料来源 :美国 人口普査局进行的长期人口调査。百分比是根据美国统计 
局提供的数据计算得到 （1969: 表37; 1979:表51; 1990:表49 ; 
1999:表 63 ) e 

这个表中的每一列都是一个截面数据，而其中年龄、世 
代和一部分组成效应相互混淆。每一行都是处于同一年龄 
的四个不同的世代，其中，时期和世代效应相互混淆。除了 
1998年年龄在25—34岁之间和1968年年龄在 65—74 岁之 
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间的世代，表中的每一个世代都可以跟踪至少10年，即表中 
从左上方至右下方对角线所显示的。在每一个世代对角线 
数据中，年龄和时期效应都相互混淆，而这个例子中的一小 
部分组成效应可以在中年后进行追踪。 

与来自截面研究的数据一样，标准世代表中的每一列都 
受到效应混淆的影响，而每一个世代对角线的数据都与来自 
固定样本追踪研究的数据一样，会将年龄和时期混淆。然 
而，在世代表中，有许多列和许多世代对角线，这使得研究者 
希望能够通过统计方法分离出年龄、时期和世代效应。多年 
前，我将试图利用统计方法分离出世代数据中各种效应的方 
法称做“徒劳的追寻” ( Glenn ，1976) ，除非在极少数的情况下 
所有的效应都是非线性的。然而，并不是所有人都放弃了这 
种尝试。试图寻找一个能够一劳永逸地应用于估计效应的 
统计方法，是科学史上重复进行那些逻辑错误的尝试中最讽 
刺的例子之一。 
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第3节 | 识别问题 


由于不可能利用统计方法分离出年龄、时期和世代效 
应，这就产生了识别问题，这一问题发生在当有3个或3个 
以上的自变量需要纳人研究，而每一个都是其他的线性函数 
的时候。换句话说，每一个自变量与其他自变量的复相关是 
唯一的——这也是共线性中可能出现的最极端的例子。如果 
所有的自变量都作为预测因子纳人回归方程或者类似的分 
析，则电脑程序不能运行。在其他变量都被控制的情况下，每 
个剩余自变量的方差均为0。例如，当我们有理由认为两个变 
量间的差别和两个变量本身都将影响因变量时，识别问题便 
发生了。一个例子即对婚姻质量的研究，丈夫的特征、妻子的 
特征和夫妻之间的差异都可能影响婚姻质量。另一个例子是 
社会流动性对幸福感的心理效应的研究，其中，出身的阶层、 
最终归属的阶层和两者的差别都可能影响到幸福感。 

在世代分析中，三个相互关联的变量当然是年龄、时期 
和世代，其中每一个都是其他两个的完全线性函数。也就是 
说，根据其中两个变量的信息就可以推知第三个变量的信 
息。例如，如果我们知道一个在1990年进行访谈的调査对 
象当时是20岁，我们就会知道她的出生年月以及她的世代 
成员信息。或者，如果我们知道一个1990年进行访问的调 
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查对象出生于1970年，则我们可以推知这个受访者当时的 
年龄为20岁。所以，如果时期和世代(或其他3个中的任意 
两个变量)都已经作为预测变量被纳入回归方程，那么再加 
人年龄就会造成冗余信息，使得电脑程序无法运行。如果有 
理由相信年龄、时期或者世代的任意一个没有效应，则剩余 
两个变量的效应很容易被估计，但是并没有直接的方法可以 
同时估计出这三个变量的效应^ 

识别问题的本质可以由表 1. 2、表 1. 3和表 1. 4中的假 
设性数据所解释，其中对每个表格中因变量值的线性变异最 
简单的解释是，它们各自仅表现了年龄效应(表1.2)、时期效 
应(表 1. 3) 和世代效应(表 1. 4)( 为了便于解释，我们假设因 
变量与寿命无关，因此也没有由不同的死亡率导致的组成效 
应)。然而，每个表中的数据同样适用于两个变量的解释，正 
如每个表底部的其他解释所显示的那样，而每个表中的变异 
模式都可能来源于年龄、时期和世代效应之间无限的组合。 
显而易见，我们无法利用统计方法本身从这些不同的效应组 
合中选择可以产生相同数据的组合。研究者的这种选择必 
须基于理论或者他们对现象来源的认识，而非基于数据本 
身。换句话说，选择必须基于菲利普 • 康威提出的“附加信 
息” (Philip Converse， 1976)。这种信息有时来自数据中记录 
的附加变量(除了年龄、时期、世代和因变量以外的变量），但 
更多时候来源于其他途径。 

研究者可能认为,尽管在逻辑上可以用1至3个变量对 
于世代数据线性模式的变异进行解释，但一个变量的解释往 
往是最有效的。然而事实并非如此。即便当变异的模式像 
表 1. 2、表 1. 3和表 1. 4那么简单，2个或3个变量的解释往 
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往与理论或者其他来源的数据更加契合。此外，哪怕只是简 
单的线性变异，也往往比表格中的假设数据复杂很多，而复 
杂的模式就需要复杂的解释。 


表 1.2 单纯显示年龄效应的数据模式(抵消了时期和世代效应, 
或者年龄效应与相互抵消的时期和世代效应的混合） 


年龄 



年 

份 



1950 

1960 

1970 

1980 

1990 

2000 

20—29 

50 

50 

50 

50 

50 

50 

30—39 

55 

55 

55 

55 

55 

55 

40—49 

60 

60 

60 

60 

60 

60 

50—59 

65 

65 

65 

65 

65 

65 

60—69 

70 

70 

70 

70 

70 

70 

70—79 

75 

75 

75 

75 

75 

75 


注:单元格中的数据是某个因变量的假设值。几个解释为:（1)每10年的衰 
老将导致因变量5点的增加 〆 2) 每10年的变化对因变量产生5点的正 
向时期效应和5点的负向世代 效应; （3) 每10年的变化使因变量存在一 
部分年龄效应和相互抵消的时期和世代效应的混合。这些效应的有限 
组合可以生成表中所示的因变量的变异模式。 


表 1.3 单纯显示时期效应的数据模式(抵消了年龄和世代效应, 
或者时期效应与相互抵消的年龄和世代效应的混合） 


年龄 



年 

份 



1950 

1960 

1970 

1980 

1990 

2000 

20—29 

30 

35 

40 

45 

50 

55 

30—39 

30 

35 

40 

45 

50 

55 

40—49 

30 

35 

40 

45 

50 

55 

50—59 

30 

35 

40 

45 

50 

55 

60—69 

30 

35 

40 

45 

50 

55 

70—79 

30 

35 

40 

45 

50 

55 


注: 单元格中的数据是某个因变量的假设值。几个解释为： （1) 每10年的变 
化将导致因变量5点的 增加; (2) 每10年的时间变化对因变量有5点的 
正向年龄效应和5点的正向世代效应; （3) 每10年的变化使因变量存在 
一部分时期效应和互相抵消的年龄和世代效应的混合。这些效应的有 
限组合可以生成表中所示的因变量的变异模式。 
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表 1.4 单纯显示世代效应的数据模式(抵消了年龄和时期效应, 
或者世代效应与相互抵消的年龄和时期效应的混合） 


年龄 



年 

份 



1950 

1960 

1970 

1980 

1990 

2000 

20—29 

50 

55 

60 

65 

70 

75 

30—39 

45 

50 

55 

60 

65 

70 

40—49 

40 

45 

50 

55 

60 

65 

50—59 

35 

40 

45 

50 

55 

60 

60—69 

30 

35 

40 

45 

50 

55 

70—79 

25 

30 

35 

40 

45 

50 


注:单元格中的数据是某个因变量的假设值。几个解释为：（1)每一个到达 
了成年的世代将比之前的世代的因变量高出5 点； （2) 每10年的变化对 
因变量有5点的负向年龄效应和5点的正向时期 效应; （3) 每10年的变 
化使因变量存在一部分世代效应和互相抵消的年龄和时期效应的混合。 
这些效应的有限组合可以生成表中所示的因变量的变异模式。 

例如，美国的年龄与工作满意度这个案例(见表 1. 5)。 
工作满意度的整体水平在过去的几十年里相当稳定，且年龄 


与工作满意度之间有稳定的正向相关关系。对于这个稳定 


关系的最简单解释就是，它反映了年龄效应或者年龄效应与 


由于进出劳动力市场导致的组成效应的混合。 


表 1. 5表示对工作“非常满意” a 的人数百分比 b 


年 份 



年 

龄 



25—34 

35—44 

45—54 

55—64 

65—74 

总计 

1972—1976 

44.4 

(1475) 

53. 9 

(1208) 

51.8 

(1358) 

60. 1 
(936) 

63.4 

(313) 

52.4 

(5290) 

1977—1980 

41.3 

49.0 

52.2 

61. 1 

60.6 

50.2 

(989) 

(769) 

(684) 

(556) 

(223) 

(3221) 

1982—1986 

42.4 

49. 1 

54. 1 

57,2 

62.4 

52.9 

(1868) 

(1384) 

(1106) 

(865) 

(320) 

(5543) 

1987—1991 

40.1 

46. 5 

50.9 

52.2 

57.5 

49.4 

(1614) 

(1553) 

(1062) 

(655) 

(277) 

(5161) 

1993—1996 

39.3 

(1483) 

44. 6 

(1563) 

47.3 

(1246) 

55. 9 

(584) 

68. 1 

(183) 

45.9 

(5059) 
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续表 


年 

份 



年 

龄 



25—34 

35—44 

45—54 

55—64 

65—74 

总计 

1998—2002 

46. 3 

(1275) 

45.6 

(1394) 

49. 1 

(1149) 

56.5 

(539) 

61.6 

(189) 

48.7 

(4546) 

总 

计 

42.2 

47. 8 

50.8 

57.3 

62. 1 

48. 9 

(8704) 

(7871) 

(6605) 

(4135) 

(1505) 

(28820) 


注: a. 其他回答为“一般满意”、“不太满意”和“非常满意”。 

b. 通过加权近似获得了受访者的人数。权重是家庭中成年人的比例除 
以 GSS 家庭中的成年人平均数量^ 

资料来源 :全国 民意研究中心 (NORC) 于1972—2002年进行的年度美国综 
合社会调査 (GSS)。 


表 1. 6因变置的非线性变异可以解释为仅仅反映了 
年龄或者组成效应的数据模式 


年龄 



年 

份 



1950 

1960 

1970 

1980 

1990 

2000 

20—29 

50 

50 

50 

50 

50 

50 

30—39 

52 

52 

52 

52 

52 

52 

40—49 

62 

62 

62 

62 

62 

62 

50—59 

62 

62 

62 

62 

62 

62 

60—69 

50 

50 

50 

50 

50 

50 

70—79 

45 

45 

45 

45 

45 

45 


注:单 元格中的数据是某个因变量的假设值。 


然而，整体水平的稳定性和工作满意度的年龄模式也迫 
使我们考虑这样的事实，即工作的条件在很多方面都有所变 
化(可能变得更好)，而近些年连续进入职场的年轻人世代明 
显对于工作条件和回报有着更高的期望。因此，这个稳定的 
年龄模式似乎部分反映了相互抵消的时期和世代效应。年 
龄和工作满意度之间关系对线性的偏离，即每一年年龄的增 
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长带来的工作满意度的增加在中年阶段比年轻和年长阶段 
较小，则显示了年龄或组成效应，这使得三个或四个变量的 
解释对这个例子更加适合。 

表 1. 2、表 1. 3和表 1. 4中因变量的变异都是线性的，但 
是年龄、时期和世代的非线性效应并没有像线性效应那样混 
淆。例如，表 1.6 中因变量指定为年龄变异的非线性模式。 
对这个数据仅有的解释为，在没有组成效应存在的情况下， 
它们反映了非线性的年龄效应，因为年龄变异非线性模式横 
跨了不同的世代和时期。如果时期的非线性模式横跨了不 
同的年龄和世代，或者世代的非线性模式横跨了不同的年龄 
和时期，则对数据的解释也非常清楚。如果这个数据反映了 
超过一种效应，那么对效应的估计当然无法通过对列联表的 
简单观测来完成。但是，正如我将在下一章解释的，如果所 
有的效应都是非线性的，那么在统计上可以依据一定的精度 
估计年龄、时期和世代效应。但是，因变量分年龄、时期和世， 
代对线性变异的偏离并不意味着这些效应可以在统计上分 
离出来。如果变异的任何主要组成是线性的，那么对这些效 
应的统计分离是不可能的。 

尽管识别问题涉及对数学定理的基本且广泛的理解以 
及世代分析之外的其他研究方法（例如，估计流动或者丈 
夫一妻子间不同的效应），但直到20世纪60年代，这个问 
题才被大部分社会科学家意识到。当时小休伯特 • 脱布 
拉洛克 (Hubert M Blalock , Jr .) 发表了一系列关于这个问 
题的文章 ( Blalock ， 1966、1967)。直到1973年才出现了一 

篇之后被广泛引用的文章讨论了世代分析中的识别问题 
( Mason , Mason , Winsborough & Poole , 1973)。这篇杰作 
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的作者用简单的语言解释了涉及的逻辑和数学问题。但不 
幸的是，这篇文章对利用统计方法解决识别问题提出了不 
切实际的期望，因此，它也造成了试图分离世代数据中这些 
混合效应的一系列错误的尝试。其中一些将在下一章进行 
介绍。 
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第 1 节 I 梅森、温斯伯勒和普尔等人 

的方法 


在世代分析中用于估计年龄、时期和世代效应最常用的 
方法就是梅森等人在1973年的经典文章中所介绍的方法。 
这个方法和它的一些变形作为有力的方法被一直沿用下来。 

梅森等人的方法的吸引力在于其简单易行。年龄、时期 
和世代都被记录为一系列虚拟变量，每一个虚拟变量代表5 
年或10年。当一系列变量作为预测变量被纳人回归，则其 
中的一个变量必须被忽略以使程序能够运行。当将年龄、时 
期和世代虚拟变量包含进来的时候，要使程序可以运行，我 
们就必须忽略一个额外的虚拟变量，它可以来自年龄、时期 
或者世代。忽略这个引人分析的附加变量与忽略一系列变 
量中的两个变量的效果是一样的，并且这一假设往往与真实 
状况并不相悖，尤其当被忽略的两个虚拟变量代表的类别是 
相邻类别的时候。 

上述方法当然不是唯一在分析中同时加人年龄、时期和 
世代作为预测变量而能够使程序运行的方法。有许多方法 
可以打破这些变量间的线性相关并使程序运行，例如对变量 
进行重新编码或者转换，即加以识别的限定。例如，年龄和 
世代可以作为连续变量而时期作为一系列虚拟变量加入回 
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归。然而当我们这么处理的时候，线性相关的问题也仅仅在 
统计模型中被打破，但在现实世界中并没有被打破，因此，估 
计出的效应并不具有实际意义。 

因此当我们决定使用梅森等人的方法时，这种选择并非 
随意的。许多研究者相信，由于相邻的年龄、时期或者世代 
的类别的效应是相同的这一假设并不违背实际，因此选择任 
意两个相邻的类别就可以。但这是梅森等人从未提及的。 

许多使用梅森等人的方法或其变形的研究者也忽略了 
文章中介绍的另一个重要部分，而这一部分内容由于出现在 
文章的脚注中，所以很难被注意到： 

这些纯粹的效应（用于解释这一方法的假设效应）的 
形式是刻意设定为非线性的……我们将数据构造成这种 
形式的原因在于，完全的线性效应是难以被解释清楚的， 

而且在世代分析中，根据纯梓效应的变量和两个剩余变 
量估计的结果是一样的 。 （Mason etaL ， 1973： 248) [1] 

换句话说，这种方法仅适用于估计非线性效应。 

当效应是线性的时候，这种方法的弱点就在表 2. 1中显 
现了，其中年龄、时期和世代可根据基于不同简化假设的模型 
来估计出其效应。为了使分析更简单易懂，我构造了一个数 
据集，它符合每10年对因变量有5点的正向时期效应以及5 
点的负向世代效应这一假设，且在1950年时，20—29岁之间 
的受访者的因变量值为50。表 1. 2显示了构造后的数据结 
果。对于这个模拟的实验，我知道计算这些效应可以利用梅 
森等人的方法并观察其运行状况，因此我使用了 4个具有不 
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同简化假设(识别限定)的模型。表 2. 1是模型的估计结果。 

表 2.1 利用梅森等人的年龄一时期一世代模型估计 
反映在表 1. 2中的效应(未标准化的回归系数） 


变量 

模型 

1 

2 

3 

4 

常数项 

年龄 

50.0 

50.0 

25.0 

28.7 


20—29 

a 

a 

0.0 

a 


30—39 

5.0 

5.0 

0.0 

a 


40—49 

10.0 

10.0 

a 

3.6 


50—59 

15.0 

15.0 

a 

6.1 


60—69 

20. 0 

20.0 

ao 

8.6 


70—79 

时期 

25.0 

25.0 

0.0 

11.4 


1950 

a 

0.0 

a 

a 


1960 

0.0 

0.0 

5. 0 

a 


1970 

0.0 

0. 0 

10.0 

3.6 


1980 

0.0 

a 

15.0 

6.1 


1990 

0.0 

a 

20.0 

8.6 


2000 

0.0 

0.0 

25.0 

11.4 


世代 
(出生年份） 






1871—1880 

0.0 

0.0 

50.0 

25.0 


1881—1890 

0,0 

0.0 

45.0 

23.9 


1891—1900 

0.0 

0.0 

40.0 

21.5 


1901—1910 

0.0 

0.0 

35.0 

19.1 


1911—1920 

0.0 

0.0 

30.0 

16.8 


1921—1930 

0.0 

0.0 

25. 0 

14.0 


1931— 1940 

0.0 

0.0 

20.0 

11.8 


1941—1950 

0.0 

0.0 

15.0 

9.1 


1951—1960 

a 

0.0 

10.0 

6.5 


1961—1970 

a 

0.0 

5.0 

3.9 


1971—1980 

0.0 

a 

a 

a 


注: a * 参照类，其值为0。 


除非相邻两个年龄层的效应是一样的(这样可以获得正 
确的估计)，否则这个方法给出的结果大体上是不正确的。 
如果两年或者两个世代效应相同的假设是适用的，那么这个 
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方法产生了一个单变量(完全的年龄效应)解决方法，同时， 
假设这一效应在两个年龄层和两年间是相同的，则会产生一 
个三变量的解释。数据本身并不能提供应该使用哪个相同 
假设的线索，因为每一个假设对于现实的扭曲程度是相同的 
(当然，相比一个假设，两个假设引入了更多的扭曲）。显然， 
能够利用模型获得正确的估计取决于对哪一种解释的预先 
了解是正确的。这种方法并不能告诉研究者究竟是变量中 
哪一种组合的解决方式最能精确地代表现实。第1章中介 
绍的其他方法同样不能解决这个 问题。 但是，由于非线性的 
年龄、时期和世代效应彼此之间的混合与线性的不同，人们 
可能会认为，这些效应可以由梅森等人的方法来很好地估 
计。另一个模拟的实验可以提供相关的证据。这一次，我假 
设非线性的纯粹年龄效应，其中，因变量在 20—29 岁群体中 
的值为 50,且 此后每 10 年的衰 老具有 的效应分别为+ 2、 
+ 10、0、_12和一5,直至70—79 岁年 龄段。 这种模式的效 
应将产生表 1. 6中的数据。我再一次使用梅森等人的方法， 
用 4 种不同模型来估计反映在数据(表 2.2) 中的效应。对于 
模型 1， 其背后的假设为 40—49 岁的效应和 50-59 岁①的效 
应是一样的，而这是符合现实的，所以这个模型获得了准确 
的估计。对于模型2,其背后的假设为，任意两个世代的效应 
是相同的，而这也是正确的，因为没有世代效应，从而使得 
APC 的所有估计都是正确的。对于模型 3, 其背后的假设 
为，任意两个时期的效应是相同的，同样，正确的简化假设使 
得对年龄、时期和世代效应的估计都是正确的。对于模型 4, 


①原书此处为30—39和 40— 49,应该是笔误，——译者注 
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其背后的简化假设为，20—29岁和30—39岁的效应是一样 
的，但这并不正确，尽管误差并不大，但是可能导致与真实效 
应完全相反的估计。鉴于一个变量（纯粹年龄效应）的方法 
是正确的，这个模型显示了 一个三变量模式的效应。 


表 2. 2利用梅森等人的年龄一 时期一 世代模型估计 
反映在表 1.6 中的效应(未标准化的回归系数） 


变量 

模型 

1 

2 

3 

4 

常数项 

年龄 

62.0 

50. 0 

50.0 

60.0 


20—29 

-12.0 

a 

9 . 

a 


30—39 

-10.0 

2.0 

2.0 

a 


40—49 

a 

12.0 

12.0 

8.0 


50—59 

a 

12.0 

12.0 

6.0 


60—69 

— 12. 0 

0 . 0 

0.0 

— 8. 0 


70—79 

时期 

-17.0 

一 5.0 

— 5. 0 

-15.0 


1950 

a 

a 

a 

a 


1960 

0.0 

0.0 

a 

2.0 


1970 

0.0 

0.0 

0.0 

4.0 


1980 

0.0 

0.0 

0.0 

6. 0 


1990 

0.0 

0.0 

0.0 

8.0 


2000 

世代 
(出生年份） 

0.0 

0.0 

0,0 

10.0 


1871—1880 

0.0 

0.0 

a 

20.0 


1881— Z 890 

0.0 

0.0 

0.0 

18.0 


1891—1900 

0.0 

0.0 

0,0 

16.0 


1901—1910 

0.0 

0.0 

0.0 

14.0 


1911一1920 

0.0 

0.0 

0.0 

12.0 


1921—1930 

0.0 

0.0 

0,0 

10.0 


1931—1940 

0.0 

0.0 

0.0 

8.0 


1941—1950 

0.0 

0 . 0 

0.0 

6.0 


1951—1960 

0.0 

0.0 

0.0 

4.0 


1961—1970 

0.0 

a 

0.0 

2.0 


1971—1980 

a 

a 

0,0 

a 


注: a * 参照类，其值为0。 
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从中获得的经验是显而易见 的:哪 怕效应的非线性模式 
与表 1. 6中所示的一样简单，但只有当简化假设是正确的时 
候，梅森等人的方法才能够获得正确的估计。然而，一个研 
究者很少能够确信某一个简化假设是一点都不含有误差的。 

当效应的非线性模式更复杂的时候，即包括两个或全部 
APC 变量的非线性模式时，梅森等人的方法或者其他的统计 
模型都不能充分解决问题。哪怕非线性效应彼此之间并不 
像线性模式中那样相互混淆，但它们之间仍然可能存在 APC 
变量之间的交互。例如，可能非线性的年龄效应在统计分析 
中反映为时期和世代之间的交互，但并非所有的时期一世代 
交互都是年龄效应。表 1. 6中的非线性变异的简单模式使 
我们很容易判断出变异反映了年龄效应，但是更复杂的数据 
则无法通过简单的观察得出结论。 

没有考虑到 APC 之间的交互是使得梅森等人的方法并 
不像很多研究者相信的那样有用的另一个原因。所有关于 
这个方法的变形都基于年龄、时期和世代效应是叠加的这一 
假设，也就是说，年龄效应对于所有的时期和世代都是相同 
的，时期效应对于所有的年龄和世代都是相同的，以及世代 
效应对所有的年龄和时期都是相同的。这个假设可以进行 
检验，但往往并不符合现实。当态度和行为的变化发生在成 
年人群体中时，变化往往在较年轻的人中更为突出。数据本 
身并不能分辨年龄一时期和世代一时期的交互，但是有理论 
表明，随着年龄的增大，成年人由于刺激而产生的变化逐渐 
变小 （ Glenn ， 1974、1980； Alwin，Cohen & Newcomb ， 

1991)。 态度的变化往往随着年龄的变化而不同，无论是更 
加激进还是更加保守，这也是我下一章即将讨论的问题。此 
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外，一些年龄效应(尤其是那些最近发生的)与社会角色而非 
生物衰老相关的变化，也造成世代间的不同，例如对中老年 
人性生活活跃度的期望有所上升。世代效应也可能随着年 
龄而变化，例如一小部分世代群体在经济和职业上的优势随 
着他们年龄的增长而扩大，却又随着更年轻世代群体的挑战 
而慢慢减小。 

通过对表 1. 1中女性结婚率的数据进行检验，可以揭 
示出叠加的 APC 模型的不完善之处以及利用附加信息解 
释世代数据的需求。这个数据中存在大量的交互。尽管结 
婚率在所有年代都随着年龄负向变化，但用年龄对1968年 
和1998年结婚率进行的回归结果显示，其系数从一 1. 012 
变为 一2. 93。此外，虽然在1968年结婚率最高的是在25— 
34岁年龄段，但在其后的时期，结婚率最高的年龄段变为 
35—44岁。同时，用年份对结婚率进行回归，其回归系数从 
25—34岁年龄段的 一 0. 696变为 65—74 岁年龄段的 
0.299。1968年处于 25—34 岁年龄段的世代在迈向 35— 
44岁年龄段时，经历了结婚率的下降，但是经过同样的衰老 
期，1978年处于 25—34 岁年龄段的世代并没有经历结婚率 
的下降，而1988年处于25—34岁年龄段的世代则经历了 
结婚率的上升。 

对这些强调交互的效应进行统计建模是困难的,哪怕识 
别问题并不会产生干扰。然而，对于熟悉美国近些年来婚 
姻、离婚和寿命的家庭人口学者来说，这种数据并非十分神 
秘。相关的趋势为：（1)从20世纪70年代末至20世纪80年 
代，典型的初婚年龄有显著的上升； （2) 从20世纪60年代中 
期至20世纪80年代，离婚率有显著的上升，而持久的婚姻 
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仅占很小一部分 K 3) 中老年死亡率从20世纪80年代之后 
又持续下降; (4) 进人较老年龄段的世代具有最高的终身结 
婚率。如果不了解这些趋势，对表 1. 1中的数据进行统计处 
理则并不能带来对数据复杂模式的深人理解。 
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第2节 | 中村的贝叶斯方法 


梅森等人的世代分析方法只有在简化假设(识别限定) 
是可以随意选择的情况下才可以随意地作为一种常规方法 
来运用，但这是一种对方法的滥用。然而，其他世代分析方 
法则希望建立一套程序化的应用，也就是说，无论理论或者 
附加信息预测出怎样的年龄、时期和世代效应，这种方法都 
可以以相同的方式进行应用。 

这些方法中最著名的可能是来自日本统计学家中村的 
研究 ( T . Nakamura ， 1982、 1986) ，并由佐佐木和铃木介绍给 
美国社会科学家 (Sasaki & Suzuki , 1987)。这个方法不变的 
简化假设就是连续的参数是逐步变化的。更具体地说，这个 
假设就是在年龄、时期和世代中，相邻的比分散的更为接近。 
佐佐木和铃木给出了进一步的 解释： 

对于一个社会现象，较短间隔内进行调查产生的百 
分比变化比较长间隔内进行调查产生的百分比变化要 
小。例如对宗教的热忱度， 20 岁年龄段和 30 岁年龄段 
群体之间的差距大致上比 20 岁年龄段和 40 岁年龄段 
之间的差距小。 （Sasaki & Suzuki, 1987:764) 
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佐佐木和铃木承认，连续的参数是逐步变化的这一假设 
并非永远正确。研究者只需要观察 APC 变量中任意两者与 
因变量之间的关系是否是单调即可。如果确实如此，或者只 
有很少的违背之处，则这个假设基本上是正确的。 

如果佐佐木和铃木对他们观点的阐述是有效的，那么这 
个方法的确是有用的，因为逐步变化这个假设可以实证地进 
行检验。佐佐木和铃木将他们的方法应用到与表 1.4 非常 
类似的世代数据中 (Sasaki & Suzuki ， 1989)，所有由年龄和 
时期导致的变异不仅是单调的，而且是完全线性的。尽管有 
无数种可能的解释且其中一些对于特定的因变量是合理的， 
但是他们总结道，数据只反映了世代效应。这显示出这个方 
法往往选择所有可能的解释中最简单的，至少是像这个方法 
所限定的简约性一样。这种解释可能通常是正确的，但仅仅 
是“通常”，这对于建议研究者使用这个方法且接受这个估计 
是正确的理由并不充分。同样，相比于考虑了更多信息而并 
不十分有力的方法得出的结论，中村的估计方法并不更加 
准确。 

显然，对中村的方法应该持怀疑的态度，但是如果估计 
是根据理论和附加信息或者是对数据模式的评估信息而获 
得的，那么便可能是有效的。例如表 2.3 中，佐佐木和铃木 
对荷兰关于无宗教归属人士的数据进行的分析 （Sasaki & 
Suzuki , 1987)。在一个独立的表中，作者指出，在所有的荷 
兰成年人口中，无宗教归属人士从1899年的 1. 8%单调地增 
长至1969年的 23. 0%。然而从表 2. 3的数据中可以看出， 
时期效应对于无宗教归属有很强的影响。当这样的时期影 
响持续时，便会出现一个与全部人口中变化方向一样的世代 
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间的变化趋势。因此，任何检视表 2. 3的分析者都能发现， 
该表显示出了数据中较大的正向时期和世代效应。尽管非 
宗教归属在表中每个世代内都经历了超过一个时期的上升， 
但并没有其他来源的理论或证据显示，随着年龄的增长宗教 
归属感会下降。因此，世代间的变化很大程度上应该是时期 
效应。 


表 2. 3荷兰无宗教信仰人口百分比(根据年龄和年份) 


年份 



年 

龄 



20—29 

30^39 

40—49 

50—59 

60—69 

70—79 

1899 

2.4 

2. 2 

1.7 

1.2 

0.9 

0.6 

1909 

5. 8 

5. 6 

4.2 

3.2 

2.4 

1.6 

1919 

8.4 

8.9 

7. 1 

5.3 

3. 9 

2.7 

1929 

15.0 

16.2 

14. 1 

11.0 

8. 1 

5.8 

1939 

16. 9 

18. 3 

17.0 

14.6 

11.2 

8.0 

1949 

18. 0 

19. 5 

19.0 

17.5 

14.3 

10.4 

1959 

18.3 

20.2 

19.8 

19.2 

17.8 

14.2 

1969 

24. 7 

23.0 

23.3 

23.1 

21.4 

19.2 


资料来 源:佐 佐木和铃木书中的表 4( Sa S aki & Suzuki , 1987)。 


表 2. 4中村的贝叶斯方法和一般最小二乘法估计得出的 
荷兰非宗教归属的年龄、时期和世代效应 



中村的贝叶斯估计 

一般最小二乘回归 

年龄 



20—29 

-0. 715 

a 

30—39 

0. 0641 

a 

40—49 

0. 0615 

a 

50—59 

0. 0473 

a 

60—69 

-0. 0063 

a 

70—79 

— 0. 0950 

a 

时期(年份） 



1899 

—1. 2301 

a 
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续表 



中村的贝叶斯估计 

一般最小二乘回归 

1909 

-0. 5361 

1.352 

1919 

-0. 2775 

2.269 

1929 

0. 2625 

6.385 

1939 

0. 3305 

7. 406 

1949 

0. 3985 

8. 042 

1959 

0. 4355 

8.732 

1969 

0. 6177 

11. 835 

世代(出生年份） 



1820—1829 

一 1. 2967 

-5.686 

1830—1839 

-1. 0314 

-7.712 

1840—1849 

— 0. 7699 

—5. 393 

1850—1859 

-0. 4908 

— 5. 137 

1860—1869 

一 0. 2230 

— 4. 208 

1870—1879 

0. 0447 

—2. 578 

1880—1889 

0. 2913 

a 

1890—1899 

0. 4545 

2.286 

1900—1909 

0.5195 

3.814 

1910—1919 

0. 5575 

4.536 

1920—1929 

0. 5754 

4.678 

1930—1939 

0. 5539 

4. 081 

1940—1949 

0. 7742 

6.579 


资料 来源: 格伦书中的表3 ( Glenn ， 1989)。 


表 2. 4显示了中村对数据中效应的估计，且估计结果精 
确地反映了理论、附加信息和对数据的非正式评估所指示的 
效应模式。在这个例子中，这个方法显然非常实用。另一方 
面，研究者也可以通过简单的假设来估计不存在年龄效应的 
情况而获得类似的结果，将时期和世代都转换为虚拟变量， 
并使用最小二乘回归来估计时期和世代对非宗教归属的效 
应(参见表 2. 4中最后一列）。从这个例子中我们可以看岀， 
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复杂的中村方法并不比简单的回归分析有效，尽管在其他的 
例子中也许是这样。 

中村的贝叶斯方法并没有被广泛地使用(至少在美国如 
此)。佐佐木和铃木认为，这种方法为世代分析中的识别问 
题提供了一个全面的解决方法,这一观点已经大致上被否定 
了。然而，这个方法有时可以对效应提供可信的估计，它也 
尽可能努力地成为分析世代的全面方法。因此，尽管中村方 
法并没有成功，但仍有许多后续的研究希望提供一个对世代 
分析普遍适用的统计方法。 
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第3节 I 后续的探索 


在本书即将完成的时候，有很多正准备出版的著作提出并 
阐释了一种能够将 APC 效应模型化的新的统计方法。由于这 
些著作仍处在“请勿引用”的阶段，我并不能总结它们的内容或 
者介绍其作者。但至少有一些作者将其新的方法称做“解决 
APC 难题的全能方法”以招徕读者，他们宣称，当数据为短时期 
多次收集获得的、可比较的重复截面数据时，应用这个方法将获 
得有效的估计。当这些方法利用已经发表的文章进行解释时， 
我们并不能要求其改变分析，并考虑到理论和附加信息以及在 
APC 变量线性模式中因变量方差的含混性。换句话说，至少有 
一些方法的鼓吹者号称他们可以解决逻辑上不可能的 问题。 

当然，如果“通常”能够获得接近正确的估计，研究者能够 
使用理论和附加信息来评价估计的可信度，且他们对所获得的 
结论持探索性态度，那么这种方法也许可以被证明是有效的。 

我对那些想要使用这种方法的研究者的建议是，不妨等 
到它已经被不同情境下模拟的实验状况完全地检验后再使 
用。或者，研究者可以自己进行这类模拟。当模拟完毕后， 
研究者应该牢记，几个对效应成功估计的例子并不能够证明 
方法是普遍适用的。此外，在模拟实验中，也应该将复杂的 
效应混合情况考虑进去。 
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第4节 | 年龄 一 ^时期 一 世代 一 特征模型 


对世代效应研究的最新进展是年龄一时期一世代一特 
征 ( APCC ) 模型 ( O ’ Brein ， 1989、2000； O ’ Brein，Stockard &• 

Isaacson , 1999)。 这些模型包括一个或一个以上的“世代特 
征”，例如世代规模或者对随世代群体而变化的家庭结构的 
测量。尽管不能控制年龄和时期而单独让世代变化，但是当 
世代的特征与世代的相关程度不太高的时候，是可以控制年 
龄和时期而让世代的特征变化的。如果研究的目标仅仅是 
为了估计选择出来的世代特征的效应，而非年龄或时期的效 
应，并且世代特征与世代之间并没有强烈的线性关系，那么 
这些模型就可以被有效地应用。但是需要记住的是，这些模 
型并不是真正的 APC 模型（尽管有时它们也用来表示 
APC ) ，且它们并不能够解决年龄一时期一世代这个难题。 

某个因变量的世代效应不可能仅仅是因为模型中包含 
的世代特征所导致的，而模型估计中的世代效应也与年龄和 
时期效应混淆不清，这样做可能导致模型估计出的时期与年 
龄效应没有意义。此外，当世代特征与世代的线性相关较严 
重时，世代特征的效应也容易与时期和年龄效应相混淆。幸 
运的是，在最近的美国数据中，世代规模与世代群体的出生 
日期线性相关较低，因此利用 APCC 模型估计世代规模的效 
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应也会较为准确。然而一些其他的世代特征，例如婚外所生 
的婴儿比例和在未成年期经历了父母离婚的世代成员的比 
例，则与世代有单调的线性关系(尽管并非完全线性)。这些 
特征都被应用在 APCC 模型中，但是它们与世代之间严重的 
线性关系会导致对其效应的估计不那么准确。 [2] 

当然,研究者可以同时构想年龄一特征一时期一世代模 
型和年龄一时期一特征一世代模型。尽管我没有看到此类 
方法的专有术语，但是在某些研究中，时期、世代和一些特征 
与年龄是具有一定程度相关的，且它们同时被当做自变量， 
此外，还有些研究中使用了可以被称做“年龄一时期一特 
征一世代模型”的方法。与 APC 模型一样，这些模型同样具 
有优点与缺点，因而需要尽量避免自变量与忽略的 APC 变 
量具有的很强的线性关系，而这样也导致对包含 APC 变量 
的估计没有意义。 
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第5节 | 对 APC 效应估算的非正式 


方法 



不能通过统计上的 APC 模型对年龄、时期和世代效应 
作出准确估计这一事实并不意味着我们要放弃对这些效应 
的区分。一旦不能精准和绝对确信地分离这些效应，那么利 
用理论、附加信息、常识以及多种统计分析来进行判断就是 
合理的。但是并没有公式或者手册适用于区分所有情况下 
的这些效应。在少数情况下，只需对交互数据进行目测即 
可，这时候我们会发现，因变量的变化与表 1. 6中的情形非 
常相似。同样，对于自变量在世代间变化的非线性模式在不 
同年龄和时期是一致的情况下，或者不同时期间变化的非线 
性模式在不同年龄和世代是一致的情况下，对此都只有一种 
可能的解释。但是对这些效应作出合理的判断往往是困难 
的，且需要研究者具有巧妙的心思、深谋远虑和良好的判断。 

为了使年龄、时期和世代效应的估计获得足够确信的结 
论，我们往往需要以很多种方法来审视数据，并引入很多种 
附加信息(参见 Abramson 8^ Englehar , 1995； Alwin , 1991 ； 
Converse , 1976； Glenn , 1994、 1998)。 而从简单到复杂的各 
种统计方法，也可能起到一定的作用。 

一种简单而有效的方法就是对介人年龄、时期或者世代 
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和因变量之间的变量进行统计控制。我们以美国为例来解 
释这个问题，在农村长大的人口比例随着不同的世代群体的 
变化而有很大的改变，那么，通过控制出生人口所在社区的 
规模来移除任何由年龄导致的自变量变异，则可能是世代效 
应而非年龄效应。例如，同胞数量或者父母是否离异这样的 
未成年时期的背景变量则可能同时介人世代与一些因变量 
之间。教育程度是另一个与世代相关的变量，但是对控制它 
所获得结果的解释必须十分小心，因为教育对于不同的世代 
自然会有不同的效应 (Alwin， 1991; Glenn, 1994)。例如，婚 
姻状况、父母状况、就业状况以及生理健康都可能介人年龄与 
各种因变量 之间; 富裕程度、失业率和政治大环境都是与时期 
相关的变量，而在世代分析中对其进行控制也较为有效。 

由于非正式的世代分析方法必须根据所面对的特殊问 
题进行应用，我并不能对所有可以被应用的有效技术 一一 进 
行介绍和解释。但是，这里我举一个以个人幸福水平为因变 
量的例子来解释一些有用的策略。 
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第6节 I 实例：一项有关个人幸福感 

的世代研究 


这个研究的目的在于尝试性地回答这些问题 :第一 ，在 
美国社会中，成年人年龄的增长对个人幸福感有何影响？第 
二，这些影响在男性和女性间有什么差别？ 

这个研究的数据来源是芝加哥大学的国家民意研究中 
心1972年至2002年间进行的美国综合社会调查 ( GSS )， 这 
个调查从1972年至1978年每年进行一次，1980年进行一 
次，1982年至1991年每年进行一次，1993年、1994年、1996 
年、1998年、2000年和2002年也各进行一次。在每次的调 
查中，受访者都会被问到如下 问题： 

综合来看，你最近的感受是非常幸福、一般幸福还 
是不怎么幸福？ 

在研究中，这个定序的三点度量往往被作为定距变量进 
行处理，这里我进行的回归分析也同样如此。然而，我使用 
了另外两个测量对汇总层次进行分析: （ 1 ) 幸福指数，即用选 
择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访 
者的比例; (2) 对于选择“非常幸福”与选择其他的受访者进 
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行一个简单的二分。 

把从1972年至2002年的数据合并在一起所得的图1 
显示了幸福指数 ( HI ) 与年龄的关系(男女分别计算)。 



18—19 20—29 30—39 40—49 50—59 60—69 70—79 80—89 

年龄 


| —男性 ——女性1 

注: a * 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

资料来源 :美国 综合社会调査1972年至2002年的合并数据 ( D^vis et aL ， 2002) 0 

图 2. 1根据年龄和性别绘制的幸福指数 a 


对于男性，年龄与幸福指数的关系是单调递增的;对于女 
性，幸福指数值在中年的时候是最高的，在更高年龄时降低， 
而在青年时期是最低的。在50岁以前，相对于男性，女性有 
较高的幸福 指数; 但是50岁之后，这个关系则正好反了过来。 

正如读者所知，幸福指数与年龄的关系也许被年龄、世 
代和删减(组成的)效应所混淆。对这个数据的第一反应的 
解释可能是男性和女性的幸福感是如何随着年龄而变化的， 
但是也有另外的解释。例如，男性幸福指数与年龄的单调正 
相关也可能由于每一个成年的世代群体都比之前的世代群 
体更加不幸福而导致的。此外，男性与女性的差别与年龄之 
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间的关系也许是由于这些年轻女性在美国社会所获得的进 


步导致的，这也造成了与较老的女性出生群体相比，较年轻 
的女性出生群体与男性之间的差距较小。 


表 2 . 5 根据年龄、时期和性别的幸福指数 a (美国，括号中为人数 ) b 


年龄 

1972- 

-1982 

1983—1992 

1993—2002 

男性 

女性 

男性 

女性 

男性 

女性 

18—19 

4.4 

(250) 

9.0 

(211) 

11.9 

(168) 

12. 6 

(151) 

11.2 

(143) 

13.4 

(134) 

20—29 

8.8 

(1059) 

21.7 

(1195) 

17.7 

(1447) 

23.4 

(1679) 

13.6 

(1261) 

19.5 

(1364) 

30—39 

19.3 

(1218) 

26.9 

(1495) 

21.9 

(1343) 

22.0 

(1680) 

22.2 

(1416) 

23.5 

(1666) 

40—49 

19,6 

26.2 

22. 1 

23. 6 

19.8 

19.5 

(1158) 

(1366) 

(1074) 

(1323) 

(1348) 

(1617) 

50—59 

23.4 

25.8 

23. 3 

20. 1 

25.2 

25.8 

(1183) 

(1319) 

(803) 

(935) 

(917) 

(1078) 

60—69 

28.6 

25.6 

32. 7 

27. 9 

34.4 

25.8 

(829) 

(906) 

(707) 

(922) 

(591) 

(704) 

70—79 

30. 5 

(471) 

25.6 

(510) 

30.7 

(407) 

26. 1 
(583) 

34.7 

(427) 

21,6 

(555) 

80—89 

33.1 

(118) 

18.3 

(147) 

29. 7 

(128) 

24. 2 
(223) 

30.1 

(146) 

11.9 

(252) 

总计 

19.1 

24.5 

22.7 

23. 3 

22.3 

21.7 

(6958) 

(7869) 

(6069) 

(7496) 

(6249) 

(7370) 


注 A 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例 o 

b . 受访^的人数是根据权重近似获得的。数据的权重是家庭中成年人 
的比例除以 GSS 家庭中的成年人平均数量。 

资料来源 :美国 综合社会调査1972年至2002年的合并想彌 (Davis et al ，2002)。 

当合并的截面数据包括了几年甚至几十年时，我们必须 
观察获得的关系是否在这段时间内是稳定的。如果不是，那 
么其中的变化则可以显示出数据应该进行怎样的解释。对 
数据的目测观察并不能发现年龄与幸福指数之间的变化模 
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式(无论男性还是女性），这一事实也同样被分性别和时期、 
根据年龄对于(幸福感 )3 点度量的回归结果所验证。男性在 
3个时期的非标准化回归系数分别为 0 . 004、 0. 003、 0 . 004, 
且每个系数的双尾检验在 0.01 水平上均显著。而类似的女 
性系数则为 0. 001、 0. 001、 0. 000,但没有一个在统计上是显 
著的。因此，对合并数据进行解释时，不考虑年龄与幸福指 
数之间的关系在1972年至2002年间的变化是合理的。 


表 2 . 6 美国人分时期、性别选择“非常幸福” a 人数的 
百分比(括号中的为人数 ) b 



男性 

女性 

男女差异 

时期 

所有年龄 




1972—1982 

33.2 

(6973) 

36. 6 
(7905) 

— 4. 4 ㈣ 

1983—1992 

32.8 

(6084) 

33. 6 
(7523) 

一 0. 8 

1993—2002 

32.4 

(6256) 

32. 7 

(7388) 

—0. 3 

变化 

年龄 (18 —34岁） 



4. 

1972—1982 

24.7 

(2641) 

34,8 

(2935) 

-10. 1 *** 

1983—1992 

28.3 

(2286) 

31.6 

(2712) 

-3.3* 

1993—2002 

27.6 

(2113) 

31.4 

(2328) 

-3. 8** 

变化 



6.3*** 


注: a * 其他的受访者选择的是“一般幸福”和“不太幸福”。 

b . 受访者的人数是根据权重近似获得的。数据的权重是家庭中成年人 
的比例除以 GSS 家庭中的成年人平均数量。 _ 

* 表示/ ><0. 05 ( 双尾检验）； ** 表示/»<0. 01 ( 双尾检验）；表示夕< 
0. 001 (双尾检验)。 

资料来源 :美国 综合社会调査1972年至2002年的合并数据 (Davis et al . ， 
2002)。 
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然而，1972年至2002年间的变化是很重要的，且必须考 
虑进来。例如，如果利用世代效应来解释男性的幸福指数与 
年龄之间的正相关是正确的，那么男性整体的幸福程度应该 
在1972年至2002年间呈下降趋势，且在最年轻的成年人 
处下降最快。尽管不能完全拒绝此解释，但是此解释遭到 
表 2. 6和表 2. 7所显示数据很强的质疑。这些数据显示了男 
性的平均幸福程度在上升，尤其在18—34岁的年龄阶段。 
同样，如果女性在较低年龄具有较高幸福水平和男性在较高 
年龄具有较高幸福水平完全或大部分是由于世代效应所导 
致的,那么女性的幸福水平应该在1972年至2002年间不断 
逼近男性，尤其在年轻成年人中。然而，图 2. 2和表 2. 6、 
表 2. 7显示出了相反的趋势。男性不断逼近女性，且与整体 
相比，这种变化在年轻成年人间更加明显。这种解释是基于 
没有严重的时期效应抵消了世代效应这一假设之上。这是 
一个合理的假设，因为时期与世代对整体趋势的影响效应往 
往(并非始终)相互加强，而非彼此抵消。 


表 2.7 对美国人幸福度 8 根据年 {1972 —2002年)和性别回归的结果 



男性 

女性 

男女差异 

所有年龄 

0. 002 _ 

—0. 001 

0. 003 

年龄 (18 —34岁） 

0. 003 _ 

-0. 001 

0. 004** 


注:& 幸福水平是根据3点进行度量的，且处理为定距变量。 

”表示夕 <0.01( 双尾 h *** 表示夕 <0.001 (双尾）。 

资料来源 :美国 综合社会调査1972年至2002年的合并数据 (Davis et aL ， 
2002)。 

图 2. 1显示出的幸福指数与年龄之间的关系反映了年 
龄效应，这也可以由反映幸福水平随着世代群体年龄在1972 
年至2002年间增长趋势的数据加以补充说明。追踪世代群 
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Q I I ■ I j J ■ I ■ ■ ■ ■ I ■ i 」 .i j t 

1975 1980 1985 1990 1995 2000 

年份 

-男性 - -女性 

注: a . 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

K 所指年份为4年一轮的最后一年。 

资料来源:美国综合社会调査1972年至2002年的合并数据 (Davis et al . , 
2002)。 

图2_2根据时期和性别的幸福指数 a (4 年一轮的均值 b , 美国） 

体间的趋势往往通过选择一个较宽的出生年份区间的出生群 
体(例如一个5年或10年的出生群体开始），并从数据中的第 
一年到最后一年对他们进行追踪。这个步骤的一个缺点在 
于，对世代中的年轻成员与较老成员进行的追踪并非经过同 
样的年龄。例如，我们选择1972年年龄为 20— 29岁的世代, 
并追踪他们至2002年，最老的成员是从29岁追踪至59岁，而 
最年轻的成员则是从20岁追踪至50岁。对某些研究而言，这 
个步骤已经足够了，但是当我们想要更清楚地了解在某个特 
殊的年龄发生了什么时，则需要对每个5年或10年的世代在 
同样的年龄进行追踪。当然，在进行此步骤时，不同世代的成 
员是在不同的时期进行追踪的。如果数据被限制为能够包含 
所有世代成员的时间点(这是为了使得样本规模足够大以获 
得可靠的估计)，则时间的跨度可能变小。在 1972—2002 年的 







0 5 0 
3 2 2 


5 


if 



20 25 30 35 

年龄 

—男——女性 

注: a * 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

b . 所指年龄为3年一轮中的中间年龄。 

资料来源 :美国 综合社会调查1972年至2002年的合并数据 (Dfevis et al ，2002)。 

图 2. 3 1955-1964 年世代的幸福指数 * 

(年龄从18岁至37岁，3年一轮的平均值}** 

在图 2. 3至图 2. 7中，我们显示了幸福指数在世代内部 
的趋势，共5个10年世代群体，从1915—1924年世代到 
1955—1964 年世代，综合起来从18岁追踪至77岁。如果对 
图 2. 1中数据的年龄效应解释是正确的，那么在每个世代 
中，男性应该经历幸福指数的上升，且男性的趋势应该比女 
性的更加令人满意。图 2. 3至图 2. 7和表 2. 8也大致符合这 
一预测。事实上，预测出的变化比图 2.1 中显示将导致产生 
年龄与幸福指数之间关系的变化更大。截面数据中男性幸 
福指数 (3 点度量)根据年龄的回归系数(非标准化)为 0. 002 
(图 2. 7)，根据世代内趋势数据获得相应的每年的变化为 
0.006( 世代的均值根据表 2. 8中的数据计算获得）。此外， 
截面数据中男性与女性回归系数之间的差别为 0. 003 
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GSS 数据中，第二种方法只能追踪20年的世代，而非30年。 



if 



第 2 章估计年龄、时期和世代效应的策略 


45 


5 - 

qI 1 ■ * ■ ■ 1 ■ t 1 1 t ■ » ■ ■ i 

40 45 50 55 

年龄 

-男性 - -女性 

注: a . 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

b . 所指年龄为3年一轮中的中间年龄。 

资料来源 :美国 综合社会调查1972年至2002年的合并数据 (Efevis et aL ，2002)。 

图 2. 5 1935—1944 年世代的幸福指数 a 
(年龄从38岁至57岁,3年一轮的平均值 ) b 


1 ——男性 ——女性 | 

注: a . 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

b . 所指年齡为3年一轮中的中间年龄。 

资料来源 :美国 综合社会调査1972年至2002年的合并数据 (Efevis et aL ， 2002). 

图 2. 4 1945 — 1954年世代的幸福指数 a 
(年龄从28岁至47岁,3年一轮的平均值 ) b 


(表 2. 7)，但是对男女之间幸福指数差异预测的世代内每年 
平均的变化为 0. 008( 根据表 2. 8中的数据计算获得)。 
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注: a * 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

b . 所指年龄为3年一轮中的中间年龄。 

资料来源 :美国 综合社会调查1972年至2002年的合并数据 (Efevis et al ， 2002) 。 

图 2. 6 1925-1934 年世代的幸福指数 * 

(年龄从48岁至67岁,3年一轮的平均值 ) b 


50 

40 


10 


60 65 70 75 

年龄 


注 A 选择“非常幸福”的受访者比例减去选择“不怎么幸福”的受访者的 
比例。 

b . 所指年龄为3年一轮中的中间年龄。 

资料来源 :美国 综合社会调査1972年至2002年的合并想据 (Ifevis et al ，2002)。 

图 2. 7 1915—1924年世代的幸禰指数》 

(年龄从58岁至77岁,3年一轮的平均值 ) b 


男性 — 女性 


男性 -女性 




o o 

3 2 
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表 2. 8 20年后对美国5个10年一组的出生群体的 
幸福感根据年龄分性别进行回归(非标 准化） 


世代 
(年龄段） 

男性 

女性 

男女差异 

1915—1924 

(58—77) 

0. 004 

-0, 006* 

0. 010* 

1925—1934 

(48—67) 

0. 009 ** 

-0. 004 

0. 013** 

1935—1944 

(38—57) 

0. 005 

0. 000 

0. 005 

1945—1954 

(28—47) 

0. 002 

-0. 003 

0. 005 

1955—1964 

(18—37) 

0. 009 _ 

0. 003 

0. 006 * 


注:幸福水平是根据3点进行度量的，且处理为定距变量。 

* 表示/ ><0.05( 双尾） ； ** 表示 p<0.01 (双尾）； m 表示 0.001 
(双尾)。 

资料来源 :美国 综合社会调查 1972 年至 2002 年的合并数据 (Davis et al . ， 
2002)。 

对这个数据最合理的解释为，世代内的趋势是由年龄和 
时期效应混合导致的，时期效应明显是由时期的影响带来 
的，这在表 2. 6与表 2. 7中的年轻人的趋势中可以显示出 
来。换句话说，最近的时期效应使得男性的幸福指数相对女 
性升高，向逐渐老化的世代中的变化增添了同向的年龄 
效应。 

表 2. 6与表 2. 7中显示的年轻人中的趋势表明了时期 
影响，但是它们同时也反映了世代效应。这些趋势在何种程 
度上可以被概念化为时期效应或者世代效应并不清楚，但是 
承认至少有一部分是世代效应，这对于解释年龄和幸福感的 
截面数据是十分必要的。例如，任何世代内幸福程度上升的 
趋势将会减少由于年龄正向效应导致的截面的年龄差异。 
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这意味着年龄对男性幸福感的正向效应往往比图 2. 1中截 
面数据所示的大。 

美国在最近几十年来，男性的幸福感明显地随着年龄的 
增长而单调上升，而且由于他们变老，正向的年龄效应也比 
数据显示的大，正如图 2.1 中所表现的那样。女性的幸福感 
符合同样的单调趋势，因为随着她们年龄的增长，与男性几 
乎所有的年龄水平相比，女性的年龄效应较低，且在年纪较 
长时呈负向。 

当世代分析的范围中包含较大年龄时，则应该考虑由于 
不同的死亡率而导致对因变量产生的组成效应。例如在这 
个研究中，不幸福的人可能比幸福的人死得更早，而这样就 
造成了数据上男性从70岁到80岁之间幸福感的大幅上升。 
同样，这种组成效应也可能发生在男性较年轻的阶段，并且 
也可能使得女性在较老时幸福感下降得没有那么严重。 

并没有明确的证据能对这种状况发生的可能性进行评 
估。老年人所报告的幸福感与他们的长寿程度相关 ( Pal - 
more & Jeffers , 1971) ，但这可能仅仅是由于人们在去世之 
前往往经历了健康程度的下降，而较差的自我感知健康程度 
与报告的幸福程度相关。如果是这样@话，那么死亡率对汇 
总层面的幸福感的正向效应则可能很大程度或者完全地被 
去世前健康程度下降的负向效应所抵消。在这里，我们需要 
但是难以获得的信息是幸福感与寿命在一生中的关联(随着 
年龄增长而产生的自我感知健康程度下降男性的幸福感 
产生了明显的正向年龄效应)。 

由此看来，我们认为死亡率差异可能并不是本研究中显 
示的、年龄和世代模式的 原因。 然而，如果很难找到对于这 
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一发现其他的原因,这对于男性从70岁到80岁之间幸福感 
的大幅上升是一个很有吸引力的解释。 

在此，我对数据进行的非正式检验为过去几十年中美国 
男性和女性的年龄对幸福感影响的方向和大致特征提供了 
有力的证据。这些效应的大小是很难进行精确测量的，因为 
它们在截面数据中与世代效应相混淆，且在世代内趋势数据 
与时期效应相混淆。我们可以使用统计模型来获得准确的 
估计，但是估计将有很大的误差，而只有当它们与根据非正 
式的方法获得的大致模型是一致的时候，估计才是可信的。 
另外，根据精确估计获得的结果并不一定比利用有关效应的 
方向和大致模式的信息更加有用。 

在对年龄和幸福感的全面研究中,对估计出来的效应提 
供理由和相关的证据自然是非常重要的。在此，我简单地指 
出，年龄对男性和女性幸福感具有不同模式的影响的一个可 
能的原因就是，男性和女性在同一年龄所处的婚姻状态可能 
不同。对任何年龄的男性与女性，已婚人士的幸福感都高于 
未婚人士。这种相关可能部分归因于选择结婚或者不结婚 
的人群的特征，但这当然在一定程度上是结婚对幸福感的正 
效应的结果。在较年轻的时候，女性比男性更倾向于结婚， 
但是在年纪较长时，男性比女性更倾向于结婚。根据1972 
年至2002年的美国综合调查数据，男女结婚人数比例的差 
异在19岁到76岁之间与年龄有着极大的线性相关 （ r 二 
0.95,以每一年的年龄水平作为分析单位)。男女表明自己 
“非常幸福”的人数比例的差异同样与年龄有着较强的线性 
相关 （ r = 0. 79 2 ) ，而男性与女性在结婚比例和表明自 己“非 
常幸福”比例的差异之间的相关系数为 0. 823。同样是用每 
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一年的年龄水平作为分析单位，且分析的样本年龄在19岁 
到76岁之间(为了使每个单元格中的样本数量大于100)，对 
男女表明自己“非常幸福”比例的差异根据年龄进行回归的 
回归系数为 0. 253( 0. 1,双尾检验），但是在加人男女 

结婚人数比例的差异后，年龄的系数下降为 0. 033( 下降了 
87%)。当控制年龄时，对男女幸福感的差异根据结婚比例 
的差异进行回归的回归系数为 0. 263(/> < 0.01，双尾 
检验〉。 

另一种解决这个问题的方法是，对男性和女性分别根据 
年龄对幸福感进行回归，之后加入婚姻状况这一协变量，比 
较它对回归系数产生的影响。当对整个1972年至2002年的 
数据进行回归时，男性和女性样本中年龄的系数分别为 
0.004 和 0. 001，它们的差别为 0. 003( p < 0.001，双尾检 

验)。在这个模型中加入了婚姻状况之后，男性样本中年龄 
的系数下降为 0. 001，但女性样卒中年龄的系数则几乎没有 
变化(因为女性的年龄与婚姻状况的线性相关几乎为0)。 

这些数据显示(尽管不能完全的证明），男性与女性在婚 
姻状况上年龄的差别在很大程度上导致了男性与女性的年 
龄效应对幸福感影响的不同。 



用世代分析理解变革 
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以下的世代分析仅限于人口的出生率、死亡率以及老龄 
化速度没有大的变化的同代。在这样相对封闭的人口中，从 
时间点 A 到时间点 B ， 群体特征的变化主要通过三种 形式: 
(1) 通过从初生和成熟的而增加的 个体; （2) 通过老龄化和死 
亡减少的人口； （3) 在时间点 A 与时间点 B ， 除去由老龄化的 
影响，群体中个体特征的变化。前两者构成“世代演替”，而 
最后一种叫做“世代内的演变”。 [3] 

在《世代分析》的第一版中 ( Glenn ， 1977)，我认为将人群 
按照上述三种变化模式细分，对于分解研究人口是非常有帮 
助的，并且建议发展相关的研究方法。至少已经有一个研究 
者格伦 • 菲尔鲍，响应了我的提议并且设计出了几种将人口按 
照上述变化分类的方法 ( Firebaugh ， 1989、1990、1992、1997)。 

在这里，我不对菲尔鲍的方法进行具体解释，因为我现在 
相信，无论是它们还是任何近似的分解方法，对于理解改变都 
不是很有帮助 ( Rodgers ， 1990)。这种分解研究仅对不具年龄 
效应的因变量有意义，即使在极为罕见的情况下，即当一个人 
高度自信地认为根本没有什么年龄效应时，这种分解的结果 
是否有效也在很大程度上取决于它所覆盖的时间范围。 

用一下一个假设的案例便可以说明年龄效应是如何使 
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得分解人口变化变得毫无意义。我们假设在25岁到64岁 
的人中，每衰老10年便获得+10的因变量。在时间点 A 与 
时间点 B 之间，年龄分布不发生变化，则从时间点 A 到时间 
点 B 只有十10的时期效应，并且随着时间的推移，“世代演 
替”也没有任何作用。从另一方面来说，年龄效应对于年龄 
分布不变人群的人口变化不发生影响，而对“演变”却存在某 
种影响(除时期效应以外）。因此，在这个假想的例子中，演 
变对于解释人口变化已经绰绰有余。如果利用菲尔鲍设计 
的或任何相近的方法，即使事实上世代演替并没有什么效 
应，也会显示出世代演替对于人口变化显著的负面影响。 

另外一个问题是，虽然世代演替在一个相对短的时期里 
对人群的变化几乎不起作用，可是如果时间足够长，则任何 
分解研究都会把人口变迁归因于世代演替。设想一下，同样 
以25岁到64岁的人群为例。40年之后，没有一个初始成员 
还会留在这个群里，自然而然，在这里没有任何人口变化可 
以归因于世代内的变化。而如果我们一定程度地细化时间， 
比如，在25年到35年之后，这将会改变由世代演替对人口 
变化产生的效应以及对可见的人口变化的解释(尽管它不应 
该产生这样的效果)。 

即便如此，如果能得到合适的数据，世代的视角对于理 
解社会、文化以及政治上的变迁总是有用的，例如，由于世代 
连续性的存在，世代分析能够识别持续下来的变化，即使这 
些变化的影响已经解释了很久。如果像某些理论以及大量 
证据表明的那样,通常时期效应对年轻人比对年长者更具有 
影响力，那么足够大的时期效应将会随之造成显著的人群内 
差别。 
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表 3.1 美国不同时期不同年龄人群对性行为态度的回归分析 


时 期 

婚 前 

婚 夕卜 

1972—1976 

—0. 022*** 

一 0.010 刪 

1977—1981 

—0. 022*** 

一 0. 007*** 

1982—1986 

-0. 015*** 

—0. 004 讲 

1987—1991 

-0.019*** 

一 0. 004刪 

1992—1996 

—0.016 偏 

0. 001 

1997—2002 

-0.014*** 

0. 000 


注： m 表示 p < 0 . 001 (双尾检验)。 

资料来 源：由 1972年至2002年美国综合社会调查的数据估算得出。负系数 
表明，年长者比年轻人更为保守。 


20世纪60年代至70年代早期美国“性革命”的影响似乎 
就说明了这样一种情况。在20世纪70年代中期，即这场运动 
的大发展时代，社会普查中关于不同性行为是否“有错”的答 
案出现了相当大的“年龄差 异”: 在行为模式上，年轻人比年长 
者更宽容自由(表 3.1) ，尤其在婚前性行为这一问题上。这些 
差异本来也许能反映出年龄效应，因为人们随着年龄增长可能 
性态度会越来越保守。不过，在下文所列的证据中，这看上去仅 
仅是由不同年龄的人对性革命的刺激有不同反应而引起的。 

20世纪70年代中期的这种人群内部差异有助于我们理 
解一个似是而非的说法，即从20世纪70年代中期开始到20 
世纪末，人们对于婚前性行为与婚外性行为呈现出截然相反 
的态度(图 3. 1)，在所有的美国人中，人们对于婚前性行为的 
态度越来越宽容，而对待婚外性行为的态度则越来越严苛。 
这两种趋势在统计数据上都是非常显著的 （0. 001双尾 
检验)。这两种趋势看似互相矛盾，因为它们彼此相关 （/> = 
0.301) 并且与其他变量有类似的相关性。因此，如果时期效 
应对这两种发生于过去几十年内且截然相反的趋向产生影 
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1977—1981 丨 1987—1991 丨 1997— 2002 
1972—1976 1982—1986 1992—1996 

年份 


•婚前性行为 


•婚外拄行为 


资料来 源:由 1972年至2002年美国综合社会调查的数据估算得出。 


(1977—1981 I 1987—1991 I 1997—2002 
1972—1976 1982—1986 1992—1996 

年份 

_—婚 前性行 - 外性行为1 

资料来源:由1972年至2002年美国综合社会调查的数据估算得出。 

图 3.1 美国不同时期对婚前及婚外性行为表示 
“总是反对 " 的沾岁以上人群的百分比 

时期效应不太可能以彼此反向的形式出现。正如笔者 
上文所述，时期效应的趋势通常体现在年轻人群的特征中。 
18—29岁人群从1972年到2002年对婚前性行为和对婚外 
性行为的态度都越来越严苛(图 3. 2)，这种趋向在人们对婚 


响，将会是非常奇怪的一件事。 


- 

-* 


8070605040302010 



(％)苌埤唞钨 


图 3. 2美国不同时期对婚前及婚外性行为表示“总是反对 
的18岁至34岁人群的百分比 
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外性行为以及婚前性行为的态度中非常显著,而在前者中体 
现得更为明显 （0. 05对于婚前性 行为 ； p = 0. 001对于 
婚外性行为）。 

综上所述，几乎可以确定地说，对整个人口而言，由于世 
代演替，人们对于婚前性行为的态度将会变得宽松，并且这 
种世代演替的效果强大到可以抵消时期效应所带来的反作 
用力(更加保守)。与之相反，人们对婚外性行为的态度趋向 
于保守，并且时期效应的作用也足够强以至于可以抵消世代 
演替在这方面的影响。这其中也许有一种趋向严格的年龄 
效应(年龄越大，态度越保守），也许没有，但是即使有，也会 
被时期效应或者世代演替的作用掩盖。 

了解这些设定时间段内的人群内曲线总是有益的，1972 
年至2002年这30年内的世代曲线在表 3. 2以及图 3. 3、 


表 3. 2美国不同年代的出生人群对性行为 
态度宽严对比的年度 (1972 —2002年)分析 


世代(出生年份） 

婚刖 

婚外 

一般最小二乘法 a 
1925—1934° 

-0. 002 

-0. 008 刪 

1935—1944 d 

0. 002 

—0. 008州 

1945—1954 e 

-0. 012*"* 

-0. 011 … 

logistic 回归 b 

1925—1934 c 

0. 004 

0. 029 ^ 

1935—1944 d 

0. 006 

0. 034綱 

1945—1954 e 

0. 030 ㈣ 

0. 035刪 


注: a . 负系数显示了越来越严苛的态度趋向。 

b . 人们的回应被分为“总是反对”对“其他态度”，正系数显示了越来越严 
苛的态度趋向。 

c . 本数据覆盖了年龄从 38-47 岁开始到 64-73 岁为止的世代。 

d . 本数据覆盖了年龄从 28-37 岁开始到54—63岁为止的世代。 

e . 本数据覆盖了年龄从 18-27 岁开始到 44-53 岁为止的世代。 

*** 表示々< 0. 001 (双尾检验)。 

资料来 源:由 1972—2002年美国综合社会调查的数据估算得出 。 
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50-1-1-1--1 

1977—1981 I 1987—1991 1997—2002 

1972—1976 1982—1986 1992—1996 

年份 

-1925—1934年世代- 1935— 1944年世代- 1945— 1954年世代 

资料来源 ：由 1972年至2002年美国综合社会调査的数据估算得出。 

图 3. 4美国不同时期及不同年份出生的人群对 
婚外性行为表示“总是反对”的百分比 

世代内婚前性行为态度的意义并不是很清楚。只有最 
年轻的群体才在统计中显示出显著的趋势，其他两个世代在 
1992年至1996年以及1997年至2002年的时间段里都趋向 


图 3. 4中都有体现。我使用根据人们态度宽严差异的二分 
法(总是反对相比于其他态度)进行回归分析。并且采用了 
顺序度量作为这张表上半部分的最小平方回归分析的 
区间。 


° I 1977—1981 ~~ I 1987—1991 ~ I ~ 1997—2002 
1972—1976 1982—1986 1992—1996 

年份 

- 1925—1934 年世代- 1935— 1944年世代- 1945— 1954年世 代 

资料来 源:由 1972年至2002年美国综合社会调査的数据估算得出。 

图 3.3 美国不同时期及不同年份出生的人群对 
婚前性行为表示“总是反对”的百分比 



5 o 5 o 5 o U 
8 8 7 7 6 6 U 

(％)灰氓一 f=tg 


o o o o o 

5 4 3 2 1 
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于严格。我和哈丁以及詹克斯 ( Glenn , Harding &. Jencks ， 
2003) —样，通过类似的数据来说明人们从刚成年到30岁时 
会因为年龄小而导致态度越来越保守，但在全部三个世代 
中，在此时期内这种类似的变化却也很有可能是由时期效应 
造成的(表 3. 3)。无论如何，时代内并没有出现越来越宽容 
的趋势，而且在年龄的成年人中也没有出现这一趋势，都显 
示出整个成年人口中越来越宽容的趋势完全是由于世代演 
替造成的，而非时期效应的结果。 

世代对婚外性行为的态度趋势的意义则更加清晰。三个 
世代都显示出强烈而明显的越来越严苛的态度趋向（表 3. 2 
及图 3. 4)。通过观察整个成年人口和年轻成年人中的类似 
趋势(图 3.1) ，我们可以推测这样的变化很大程度上是由时 
期效应引起的，尽管年龄效应在这里不能被排除(随着年龄 
增长，态度趋向严苛)。在这里，趋向严格的时期效应必须足 
够强大，除了能够形成明显可见的趋势外，它还需要抵消由 
世代演替所引起的在该分析时期的早期所产生趋向宽松的 
反效应。在表 3.1 中，在“1972—1976”以及“1987—1991”的 

时间段内，年龄与采取严苛态度之间的正相关显示了这样趋 
于宽容的效应。 

尽管如此，如表 3. 1所示，在20世纪90年代中期，年龄与 
婚外性行为之间的对应关系却消失了。这个变化也许是由于 
青年人转而比年长者采取更加严苛的态度所造成的，但也有 
可能是因为刚成年的新世代所采取的态度与年长者更为 
相似。综上所述，这些发现其实与“对于可能导致变化的刺 
激，年轻人群更容易受影响”这个假设是一致的，但图 3. 4中 
的趋向曲线却没有显示出三个世代的单调收敛性。此外，由 
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于天花板效应，最年长组比起年轻组，趋向变化要少一些，也 
就是说，由于该组成员的态度实际已经非常严苛，这使得一 
些测量工具无法测量出他们是否变得更严苛。 

当对一个连续变量用二分法进行测量时，即将对性行 
为态度的测量分为“总是错的”和“其他”两种答案时，将百 
分比转化为 logit 形式是可以帮助修正“天花板”和“地板”效 
应的。这个转换包括将不平等百分比转换为发生比，并对 
发生比进行对数转换。基于连续变量的分布大体是正态的 
这一假设，相比于50左右的百分比差异，这个过程给接近0 
或100的百分比差异更大的权重。当然，这种“修正”的正 
确性取决于假设的正确程度。 

与图 3. 4中表现的百分比对应的 logit 转换结果展现在 
图 3. 5中。 


0 


1977—1981 I 1987—1991 I 1997—2002 
1972—1976 1982—1986 1992—1996 

年份 


■1925 —1934年世代 


■ 1935一1944年世代-1945一1954年世代 


资料来 源:由 1972年至2002年美国综合社会调査的数据估算得出 

图 3. 5美国不同时期及不同年份出生的人群对 
婚外性行为表示“总是反对"的 logit 转换 


(％)灰饵一 F 也' 


在1972年至1976年间，该数据仍然体现出世代内差异 
的净减少，但它同时也体现出不同世代间的差异(19 77 年至 
1981年及1987年至1991年间）。因此，通常意义上来说，这 
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样的数据过于“凌乱”以至于不能支持该假设。造成这种情 
况的原因是多种多样的，除了年龄效应被复杂化以外，还可 
能是因为年长者对于变化刺激的反应其实与年轻人相一致 
(只是不那么迅速)所造成的。 












数据要求与数据可用性 
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第1节 | 数据要求 


我们通常都在两个或更多时间点上来收集世代分析的 
数据，而且最有用的数据通常都覆盖几十年的时间跨度。很 
显然，世代分析不会按照教科书中的顺序来制定研究计划、 
收集数据和进行分析，因为它的数据形式和数据可用性都是 
由其他学者根据其他目的而收集的。换句话说，它们其实只 
是二手数据。反之，有用的数据通常都是从样本研究中直接 
获得的，尽管其中有些数据 ( 比如人口普查资料)原本是针对 
所有人而非特定人群进行的。 

世代分析的一个重要要求就是，所研究的人群要近似于 
“封闭”，也就是说，除了出生和死亡人口以外，人口流动性要 
较小，或者当使用划分年龄的子样本的数据会通过老龄化而 
产生变动，比如使用25岁至64岁的人群作为研究对象。用其 
他方法所导致的人口的变动可能使人口年龄特性变化出现假 
象，或者掩盖已经发生的变化。因此，地区、州(美国的州)、社 
区以及类似的地区不适合进行世代分析研究，那些已婚人士、雇 
员或者有高度渗透性边界的群体也不适合。尽管没有什么人是 
完全封闭的，但单一民族国家的成年人却异乎寻常地适于进行 
世代分析，除非这个国家经历过大规模的移民。根据性别、种 
族、民族甚至宗教进行分组的人口也同样足够封闭。当然，根据 


第 4 章数据要求与数据可用性 63 

成年前的背景资料进行的人口分组在其成年后也是封闭的。 

世代分析的第二个重要要求就是，在不同时间点所收集 
的数据必须具有可比性。比如调查问卷的数据，所有题干和 
可供回答的选项必须保持一致，除非有证据证明这些不一致 
不会导致反应类型的变化。问卷措词的微小不同可能导致 
反应类型大相径庭，所提供的选项顺序不同也会导致结果有 
很大的出入。比如，在一个关于生活满意度的调查问卷中， 
调查对象被要求按照从“完全满意”到“完全不满意”的几个 
数值范围中进行选择。满意度排序的最先选项可能导致调 
查对象的选项发生变化。数值范围的中间选项是用言语表 
示还是用数字表示也可能会导致结果的不一致。 

即使调查问卷的题干的措词和选项都一样，结果还是有 
可能有差别。由不同的问卷调查组织收集的数据可能因为 
样本设计、访谈人士的训练和监管、编码程序（机构效应）而 
不同，通过不同调查方式(面对面、电话、自行管理)所得的数 
据，严格意义上并不具可比性(模式效应）。更重要的是，早 
前被问到的问题，尤其是刚问过的问题，会极大地影响调查 
对象的答案(问卷语境效应）。比如，关于总体生活满意度的 
问题是否出现在关于某个领域生活满意度问题之前，所导致 
的选择很可能很不一样。 

很明显，用可以比较的数据追踪世代间的趋势，或用某 
一年龄层内连续的世代演替来追踪单一年龄层内的变动趋 
势。而不明显的是，即使可比较的数据也会给未发生的趋势 
制造已经发生的假象或者掩盖真实趋势。这一点在图 4.1 
中已经详细举例说明了。该图显示，在关于高中女生对生活 
满意度的调査问卷中，由密歇根大学社会研究所进行的“监 



年份 

表格 1 - -表格2 

资料来 源:由 1976年至2000年“监控未来调査”问卷得出。以7分为生活满 
意度标准值，完全满意则加3分，完全不满意则减3分，表格2用 
文字标注的形式来标示所有7个问题。 

围 4.1 美国高中女生年度生活满意度值 
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控未来调査”中用两份不同的二次抽样样本所得到的选择结 
果存在组别趋势的差异。 

在年度调研的表格1中，学生被要求使用包含7个数值 
的量表对其生活满意度进行评估，该数值范围将“完全满意” 
放在第一位，最后是“完全不满意”。数值范围的中间值是 
“中性”，数值范围的其他点则仅仅使用了数字而不是数字和 
文字并用。在询问了关于生活的11个具体方面的满意度之 
后，包括从“你的教育经历”到“你是如何打发闲暇时间的”， 
学生们被要求评价“生活整体满意程度”。在表格2中，调研 
人员先对二次抽样中独立抽出的学生们问了许多完全不相 
关的问题，然后询问他们:“最近你的生活整体满意度如何?” 
问题的选项先列出了“完全不满意”，然后才过渡到“完全满 
意”，并且这7个等级数值范围的中间值包含了数字和书面 
标签，比如“相当满意”或“还算满意”。在图 4. 1中，我给“完 
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全满意”标上+3分，“完全不满意 ”标一 3分，中间值标0分。 
每年每张表格的平均反应值都被绘制在数据中。 

尽管表格1和表格2的问题在名义上是一样的，但不仅 
平均反应值不同，而且几十年来的发展趋势也朝相反的方向 
进行。当使用问卷总数进行分析时，表格1中的问题所得出 
的平均值与年份的相关系数是一 0. 458,是具有统计意义的 
(p < 0. 05,双尾检验），而表格2的平均值与年份的相关系 
数是 +0.793( /><0.01，双尾检验)。很明显，这两个相关系 
数都不能准确指明美国高中高年级女学生生活满意度的最 
新发展趋势。 

出现这两种相反趋势变动的原因尚不知晓，因为这两份 
关于生活满意度的调査问卷有3个地方不同。第一也许是 
最重要的一处，表格1中关于生活整体满意度评价的问题是 
在问了生活的11个相关方面满意度的问题之后提到的。第 
二，表格1的该选项是按照“完全满意”在先，过渡到“完全不 
满意”的。第三，表格1仅在局部范围内用数字来标示7个 
选项中的4个，而表格2是用文字形式标示所有7个选项。 

这种对两个问题应答的不同趋势很有可能(虽然不确 
定)是由提问顺序效应引起的，因为对于表格1内一部分特 
定问题的回答显示出向下的趋势。也就是说，前述问题可能 
引起了人们对生活中满意度下降的思考。回答问题中的一 
种趋向可能会产生一种延续诙趋向的表象或是假象，但如果 
在后续阶段受到提问顺序效果的影响，则有可能产生变化。 

从这个例子中我们了解到，如果对因变量的测量很容易 
受到问题顺序效应的影响，则应该在世代分析中尽量避免这 
类测量。如果使用了这种方法，得出的分析结果应当标注明 
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显的警示。 

由于样本设计的变化，由同样的机构按照同样的形式 
(例如面对面调査)在不同时期收集的数据也许是不具有可 
比性的。正如我在下文中将指出的，在20世纪30年代、40 
年代以及50年代所进行的那些民意调查对于分析趋向以及 
世代分析而言，都是有用的资源，但不幸的是，早期民意调查 
所收集的那些数据与新近的数据不具有可比性，即使是由同 
一个机构收集的数据。早期调查是以控制配额的方式来设 
计样本，并按照由年龄、性别、地区对不同人群进行配额。例 
如 ，一个 调查可能需要10个男性受访者、10 个 女性受访者、6 
个35岁以下的受访者、8个35岁至39岁的受访者以及6个 
60岁及以上的受访者。考虑到这些限制，调研者就已经确定 
了寻找目标受访者的大体方向，而这个致命的缺陷会导致严 
重的偏误。到20世纪50年代后期，尽管全概率样本在美国 
人口普查局以及类似的学术机构中(如密歇根大学的调查研 
究中心)还没有被使用，但大多数民意调查都已经采用了更 
为精密的抽样设计方法。最典型的例子是 ，一 种类似于全概 
率抽样的分阶段地区抽样过程被用于街区层级的抽样，但是 
在选定受访者的最后阶段，配额选择仍然是重要的方法。这 
种形式的样本被称做“改良概率抽样”或“配额概率抽样”，与 
已经确定了受访者选择方式的配额控制抽样有重大的区别， 
并且访谈中不存在选择受访者的问题。严格地说，用这样的 
方式取得的数据与配额数据抽样和全概率抽样都不相容，但 
很显然，它们与后者可能更接近一致。 

美国民调抽样方式最重要的改变出现在美国盖洛普民 
意测验机构，这个机构早年叫做“美国民意调查研究所”。盖 
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洛普第一个伟大的成就是预测了 1936年总统选举的结果， 

在此后的20年间，这个机构一直拥有敏锐的政治眼光并主 
要关注总统选举。盖洛普早期的样本自然也是为代表选民 
而不是全体成年人口设计的。在这样的样本里，那些选举权 
较低的选民明显代表名额不足，像妇女、黑人以及没有受过 
高等教育的人 。自 20世纪50年代早期开始，盖洛普的样本 
开始改良，这个过程直至1958年。此次改良计划使选择其 
他应答的受访者的百分比上升8到10个百分点。 

盖洛普所收集的数据曾经涵盖了大量趋向研究和世代 
分析可用的数据，我曾经建议采用多重标准化程序以使盖洛 
普早期和晚期收集的数据有可比性。这些数据有时会很有 
用，但随着不同时期、不同主题(社会学家们感兴趣的）的高 
水平学术调研所收集的数据越来越多，盖洛普的数据已经不 
像以前那么有吸引力了。因此，笔者在此不再讨论采取技术 
手段使盖洛普早期和后期收集的数据相匹配的问题。大多 
数世代分析所用的数据也不存在这个问题。 

还有一些问题不像盖洛普早一晚期数据匹配这么严重， 

它们是由主流民意调查机构将其调研方式从面对面改为电 
话采访而引起的。这些问题在加世纪70年代末到80年代 
初尤为典型，虽然它们并未严重到不足以影响对于同一机构 
所收集的早期数据和晚期数据的运用，但研究人员必须了解 
什么时候该用电话调研方式，并且要寻找那个时期对一些重 
复问题的应答的突然转变。 

在美国的大多数民意调查中，年轻人并没有像年长者那 
样充分被代表，由此引发的一个可比较性问题经常被人们忽 
视(包括我)。几乎所有的主流民意调查样本都只研究没有 
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被制度化的人群，而“成群驻扎”的人们并没有被列人研究对 
象，它包括监狱、医院、军营以及学校宿舍等地方，除医院以 
外，此类地方都有很多年轻人。这种由于上述群组年轻人代 
表名额不足所引起的偏差，在某种程度上是可抵消的，因为 
从贫困的学生到中高阶层的学生都被排除在样本之外。但 
是，对某些变量来说，这种净偏差是不可忽略的。 

研究世代分析的学者应当注意这种潜在的变化并注意 
这种存在于成年期早期及中晚期之间的变量的变化。不过， 
这个问题对大多数世代分析来说，似乎并不重要。老年人与 
年轻人世代是否可以进行比较，则可以通过观察随着年龄的 
增长，世代内背景特征是否相应变化来进行评估。任何群体 
内显示的变化如果不是抽样错误的结果，就一定是样本间没 
有可比性的结果。基于这种估计，运用第2章所提到的关于 
幸福感分析的程序以及对同样年龄范围内(不是同样时间范 
围内)的个体进行以1年为单位的跟踪，而非整个相同的时 
期的追踪。我运用这个步骤，分析了几个未成年背景特征， 
没有发现这种人群内表现出性观念的变化(随着年龄增长)。 
在图 4. 2中，我们可以看到这样一个例 子：自 1955年至1964 
年，在美国出生的世代从30岁开始就被追踪调研，并且我们 
假设这个人群的个体中，只有一位接受过高中教育的母亲。 
在此背景特征下，表示性观念变化的百分比自个体接近20 
岁到25岁左右的阶段出现了一定程度的下降，这大概是因 
为大学生回归到了样本人口的范围中，并且在30多岁时依 
然保持该状态。这种已经显示出来的细微变化对于世代分 
析的结果不会产生很大影响。尽管如此，那些对于年轻人年 
龄效应没什么特别兴趣的学者还是倾向于用25岁而不是18 
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资料来源 :由 1972年至2002年美国综合社会调查的数据估算得岀。 

图 4. 2美国1955年至1964年出生的世代中受访者母亲 
接受过离中教育的百分比 ( 根据年龄，每3年计算一次均值) 


岁作为它们分析的年龄起点，以降低由年龄相关样本的不可 
比性而引发的偏倚的概率。 
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第2节 | 数据可用性 


本书中，我在例子中引用的数据大多来源于美国综合社 
会调查(在1972年至2002年间每年或每两年进行一次)。美 
国符合社会调查中有很多重复性的问题我并未使用，有一些 
问题是从1972年到2002年全部包括的，有些是从1973年开 
始的，还有的至覆盖了很短的一个时期。在这些问题中，有 
的问题在每个调查中都会出现，而有的则以一种螺旋式的方 
式呈现，例如在两个连续的调查中被提出，结果该问题在下 
一次社会调查中不出现，然后又出现在两个新的连续的调查 
中。近年来，社会普查数据每两年进行一次，其中的样本自 
然是早些年样本大小的两倍，并且这些数据涵盖了很多只有 
一部分受访者会被问到的问题。 

美国综合社会调查中的一些更深入的问题涉及对社会 
生活各方面的满意程度、对当前形势的信心、思想意识取向、 
政党认同感、投票参与总统竞选的情况、工作满意度、工作态 
度、疏远感、志愿者组织成员资格、对孩子成就的期望、对堕 
胎的态度、词汇量、宗教偏好、宗教信仰、民族态度以及吸烟、 
饮酒状况等。和大多数面对面调查以及电话调查一样，美国 
综合社会调查的抽样对象是家庭而非个人，因此，这样的样 
本必须根据家庭中个体数量被重新加权，以确定它能够代表 
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未被制度化的成年人群体(没有被重新加权的数据过高代表 
了只有一个成年人的家庭中成年者的数量，过低代表了多个 
成年者家庭中成年人的数量)。为了保证研究中显示的受访 
者与实际受访者数量一致，我们使用一个部分加权而不是原 
始的家庭中成年者数量。这个加权平均值由分割家庭中的 
成年者的数量除以美国综合社会调查中得到的家庭平均承 
认数量得出，其值为 1. 94(1972 年至2002年间）。这个权数 
估算可以在每一个调查中进行，但它通常只在由所有调查数 
据构成的汇总文件中才能进行。在1982年和1986年的调査 
中包括了一个权数来处理黑人的过度抽样，但随着美国综合 
社会调査的文件越来越大，黑人的过度抽样变成相对非常小 
的一个部分，对此进行加权对结果几乎没有影响。纯粹的统 
计学理论研究者可以给每一次调査相等的权数，但这么做其 
实是拘泥于细节而没什么应用价值的，并且它对整个研究结 
果的影响可以忽略不计。 

美国综合社会调査的数据可以通过多种来源获得，从洛 
普公众意见研究中心的光盘到社会及政治研究校际联合会 
的网站上都可以获得，还可以在洛普中心买到编码簿。美国 
选举研究 ( ANES ) 比美国综合社会调查提供了更多的重复提 
出的问题，包括好几个系列，比如是否缺乏政党认同感等等， 
这个问题从1948年第一次 ANES 进行以来，就一直包含在 
调查之内。其他几个“系列”从1952年开始，并且这些问题 
所覆盖的时间长度比美国综合社会调查中覆盖时间跨度最 
长的问题还要长。其中一些问题是每两年一问，而有些是每 
四年一问。这些问题大多是从政治视角出发，为政治参与 
度、政治体制的选择以及党派偏见提供了数据，但是社会学 
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者、社会心理学者、经济学者，还有政治家都可以从中获得有 
用的数据。例如， ANES 问了许多关于政策方面的问题，涉 
及医疗保障、民权行动、堕胎以及军事、经济等方面。 

ANES 有自己的网站，通过选择所需信息表格的引导， 
你可以在上面下载你需要的数据，并且加权信息也是给出 
的。在进行世代分析或者其他覆盖时间范围较久的社会分 
析以前，你必须好好研究这些复杂的信息。有些加权信息是 
从1994年才开始提供的，并且如果你要使用早年的数据，你 
就会发现这些不同时期的数据完全不具有可比性。 

除美国之外，一些其他国家也在实践类似于美国综合社 
会调查和 ANES 的信息采集工程。我们可以从社会及政治 
研究校际联合会的网站上找到其中的一些数据，但有一些只 
能在美国以外的档案馆或网站上找到。 

一个能给世代分析带来巨大好处并且已经收集了很多 
有用信息的数据收集项目是“世界价值调查”，一个关于社会 
文化与政治变迁的世界性调査。第一次世界价值调查从 
1981年至1984年，其后还有1990年至1993年、1995年至 
1998年以及2000年至2001年3次，每次调査都包括80个 
左右的国家，且每个国家包括超过1000名受访者。有20余 
个国家参加了所有4次调查并且提供了重复并具有代表性 
的数据，我们可以用这部分数据来进行世代分析。这项调查 
提出了一大批多种多样的问题，如环境问题、社会规范问题、 
对婚姻及家庭的态度、性观念问题以及政治态度等等。前三 
次世界价值调査的数据可以从社会及政治研究校际联合会 
的网站上找到，并且在本书即将完成的时候，第四次调查的 
数据将被提供给大众。关于这项调查的最新信息可以在世 
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界价值调查网站上找到。 

尽管有其局限性，但商业民调数据对于世代分析，仍是 
一种十分有用但却未被充分使用的数据，它所提供的数据周 
期很短而不像一般社会普查那样是1年至4年(在此期间有 
很多重复的学术研究）。在美国，很难想象有什么主题不是 
以民意调查形式来进行的，并且有很多好的问题被重复发问 
了数年甚至几十年。民意调查主要由两个机构 负责: 康涅狄 
格大学的洛普公共意见研究中心以及北卡罗来纳大学教堂 
山分校中由奥德姆学院负责的路易斯 • 哈里斯数据中心。 
洛普中心是世界上历史最悠久也是最大的民意调查中心，它 
保有自1935年以来由民意调查机构所收集的绝大部分非专 
利数据。人们可以通过洛普中心的网站来搜寻数据，但数据 
仅对中心成员以及缴纳使用费者开放。另外一个主要的民 
意调查机构——路易斯 • 哈里斯中心——所收集的大部分 
数据，仅对奥德姆学院可用，这也使得后者保存了自1958年 
开始的超过1200个由哈里斯中心所做的民意调查的数据. 
人们同样可以在奥德姆学院的网站上搜寻数据，并且某些数 
据可以在线获取。其他各工业化国家至少拥有一家保存了 
丰富民意调查资料的机构。 

不幸的是，在某些早期民意调查中，年龄至分了较大的 
类别，这使得它们对于世代分析的价值非常有限。要为世代 
分析寻找合适的民意调查数据，在消耗大把的时间和进行数 
据研究之前，人们还应当看看年龄是不是精确测量的。 
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世代分析的前景是光明的，因为有大量的可用数据能够 
支撑这种研究继续前行，并且，现在其实已经有大量的数据 
可以帮助我们理解年龄、社会以及文化的变化。尽管不会有 
一种绝对理想的方法被应用于“年龄一时期一世代”难题，但 
仍然会有方法论上的不断改良，从而推动世代分析研究的 
发展。 

采用精密的统计方法而不是本文所涉及的简单方法会 
对世代分析产生积极的作用，尽管这些方法仍不能解决“识 
别”问题。我们应当承认，这些努力对于其他社会研究和世 
代分析来说，都有其意义，但显然专门为世代分析而设计的 
研究方法一定会更有效。 

不幸的是，在短时期内，这些其他的研究方法对世代分 
析的意义是有限的，因为分析中既要用到过去的数据，又要 
用到新近的研究结果。世代分析依然会受到“所使用方法不 
够先迸”这样的批评。尽管如此，世代分析自身的高敏感性 
对解决其方法论问题仍然会有所帮助，其中一个例子就是本 
书第一版发行之后，大家对于问题顺序效应有更清晰的 
认识。 

目前为止，几乎所有的世代分析都会用面对面调査这种 
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形式以获得数据，但几乎可以断定的是，这样的问卷调查以 
后会更依赖于其他方式以获得数据，例如通过电话调查来获 
得数据。这些以其他方式所获得的数据会引起一些问题，而 
笔者在专著中并未提及或仅仅是一笔带过。例如，与面对面 
调查相比，与年龄相关的抽样的不可比性在电话调查中可能 
是不同的。如上文所述，不可比性是由于在同一个研究中数 
据是由不同管理问卷的方法而导致的，并且会产生一些至少 
在不同时间利用电话调查一样严重的问题。为了进行电话 
调查，应答机与来电者身份确认制度的广泛运用可能会引起 
新的偏误，并且目前还没人知道越来越多的家庭成员仅仅依 
赖于手提电话而对调查结果产生的影响。 

世代分析所面对的逻辑难题始终一样，然而它所涉及的 
技术手段却一定会改变，而且会在未来的几年里迅速改变。 
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注释 


[ 1 ] 梅森和其他人没有指出在一个相对独立的可变年龄的范围内，对于一 
个线性变量，可能存在一个三变量解释。 

[2] 人们可能会奇怪，为什么像群内成员父母离婚比率这样的数据也被用 
于个人层面的研究。这样做是基于一种假设的关联效应 :父母 没有离 
婚的儿童与青少年会受到父母离婚的同辈的影响，当然还有年龄关联 
效应以及时期关联效应。 

[3] 年龄效应有时会被错误地列为可变因素之一。事实上，只有当群内年 
龄分布改变时，年龄效应才是相对可变的，这种情况在出生组(适合进 
行出生组分析)中随着队列演替而发生。 
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译名对照表 


additive model 

叠加模型 

age cohort 

年龄世代 

age effect 

年龄效应 

Age-Period-Cohort model (APC) 

年龄一时期一世代模型 

Age-Period-Cohort-Characteristic(APCG) 

年龄一时期一世代一特征 

birth cohort 

出生世代 

cohort 

世代 

cohort diagonals 

世代对角线 

cohort succession 

世代演替 

compositional effect 

组成效应 

control group 

控制组 

cross-sectional study 

截面研究 

identification problem 

识别问题 

intracohort change 

世代内的演变 

panel conditioning effect 

条件习惯效应 

panel study 

固定样本跟踪研究 

practice effect 

练习效应 

quasi experiment 

准实验 

question-order effects 

，问 题顺序效应 

quota control sampling 

控制配额抽样 

randomized experiment 

随机实验 

side information 

附加信息 

small birth cohort 

小型生育世代 

standard cohort table 

标准世代表 
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